Accéder au contenu principal

Algorithme Simple VSR

Ce composant est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Ce scénario décrit un Job simple comparant des colonnes dans le fichier d'entrée à l'aide de la méthode de Jaro-Winkler, sur les colonnes lname et fname, ainsi qu'à l'aide de la méthode de correspondance de q-grams sur la colonne address1. Il groupe ensuite les enregistrements de sortie dans des flux de sortie :
  • Uniques : liste les enregistrements dont le score du groupe (distance minimale calculée dans l'enregistrement) est égal à 1.

  • Matches : liste les enregistrements dont le score du groupe (distance minimale calculée dans l'enregistrement) est supérieur ou égal au seuil défini dans le champ Confident match threshold.

  • Suspects : liste les enregistrements dont le score du groupe (distance minimale calculée dans l'enregistrement) est inférieur au seuil défini dans le champ Confident match threshold.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !