Définir une clé de rapprochement avec l'algorithme VSR - 7.1

Guide utilisateur de Talend Data Services Platform Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Services Platform
task
Création et développement
EnrichPlatform
Studio Talend

Procédure

  1. Dans la zone Record linkage algorithm, sélectionnez Simple VSR Matcher s'il n'est pas sélectionné par défaut.
  2. Dans la zone Data, cliquez sur l'onglet Select Matching Key puis sur le nom de la colonnes/des colonnes sur lesquelles appliquer les algorithmes de rapprochement.
    Les clés de rapprochement ayant le nom exact des colonnes d'entrée sélectionnées sont listées dans la table Matching Key.
    Pour supprimer une colonne de la table, cliquez-droit dessus et sélectionnez Delete ou cliquez sur son nom dans la table Data.
  3. Sélectionnez les algorithmes de rapprochement à utiliser dans la colonne Matching Function et l'opérateur null dans la colonne Handle Null.
    Utilisez les méthodes de rapprochement Levenshtein et Jaro-Winkler sur les prénoms et noms de famille, respectivement et récupérez les enregistrements en doublon.
    Si vous souhaitez utiliser un algorithme de rapprochement externe personnalisé, sélectionnez Custom et utilisez la colonne Custom Matcher pour charger le fichier Jar de l'algorithme personnalisé.
    Pour plus d'informations concernant les paramètres des règles de rapprochement, consultez la documentation du tMatchGroup dans le Guide de référence des Composants Talend.