Définir une clé de rapprochement avec l'algorithme VSR - Cloud - 8.0

Guide d'utilisation de Talend Data Fabric Studio

Version
Cloud
8.0
Language
Français (France)
EnrichDitaval
Data Fabric
Product
Talend Data Fabric
Module
Studio Talend
Content
Création et développement

Procédure

  1. Dans la zone Record linkage algorithm, sélectionnez Simple VSR Matcher s'il n'est pas sélectionné par défaut.
  2. Dans la zone Data, cliquez sur l'onglet Select Matching Key puis sur le nom de la colonne/des colonnes sur lesquelles appliquer les algorithmes de rapprochement.
    Les clés de rapprochement ayant le nom exact des colonnes d'entrée sélectionnées sont listées dans la table Matching Key.
    Pour supprimer une colonne de la table, cliquez-droit dessus et sélectionnez Delete ou cliquez sur son nom dans la table Data.
  3. Sélectionnez les algorithmes de rapprochement à utiliser dans la colonne Matching Function et l'opérateur null dans la colonne Handle Null.
    Utilisez les méthodes de rapprochement Levenshtein et Jaro-Winkler sur les prénoms et noms de famille, respectivement et récupérez les enregistrements en doublon.
    Si vous souhaitez utiliser un algorithme de rapprochement externe personnalisé, sélectionnez Custom et utilisez la colonne Custom Matcher pour charger le fichier Jar de l'algorithme personnalisé.
    Pour plus d'informations concernant les paramètres des règles de rapprochement, consultez la documentation du tMatchGroup dans le Guide de référence des Composants Talend.