Définir une clé de rapprochement - 7.0

Guide utilisateur de Talend Data Management Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Management Platform
task
Création et développement
EnrichPlatform
Studio Talend

Procédure

  1. Dans l'éditeur de règle et dans la table Matching Key, cliquez sur le bouton [+] pour ajouter une ligne à la table.
  2. Configurez les paramètres de la clé de rapprochement comme suit:
    • Match Key Name : saisissez le nom de votre choix pour la clé de rapprochement.

    • Matching Function : sélectionne dans la liste le type de rapprochement à effectuer. Sélectionnez Custom si vous souhaitez utiliser un algorithme externe personnalisé.

      Utilisez les méthodes de rapprochement Levenshtein et Jaro-Winkler sur les prénoms et noms de famille, respectivement et récupérez les enregistrements en doublon.

    • Customer Matcher : cet élément est utilisable uniquement avec la fonction de consolidation Custom. Parcourez votre système et sélectionnez le fichier Jar de l'algorithme personnalisé.

    • Confidence Weight : configure un poids numérique (entre 1 et 10) sur la colonne que vous souhaitez utiliser comme clé de rapprochement. Cette valeur est utilisée pour donner une plus grande importance ou une importance moindre à certaines colonnes lors de l'opération de rapprochement.

    • Handle Null : spécifie comment traiter les enregistrements de données contenant des valeurs nulles.

    Pour plus d'informations concernant les paramètres des règles de rapprochement, consultez la documentation du tMatchGroup dans le Guide de référence des Composants Talend.
  3. Dans le champ Match threshold, saisissez le seuil de probabilité. Deux enregistrements de données correspondent lorsque leur probabilité est supérieure à cette valeur.
    Dans le champ Confident match threshold, configurez une valeur numérique comprise entre la valeur du champ Match threshold et 1. Au-dessus de ce seuil, vous pouvez avoir confiance en la qualité du groupe.
  4. Pour définir une seconde règle de rapprochement, placez votre curseur dans le coin supérieur droit de la table Matching Key et cliquez sur le bouton [+].
    Suivez les étapes pour créer une règle de rapprochement.
    Lorsque vous définissez de multiples conditions dans l'éditeur de règle de rapprochement, une opération de rapprochement OR est effectuée sur les données analysées. Les enregistrements sont évalués par rapport à la première règle.
  5. Si nécessaire, placez votre curseur dans le coin supérieur droit de la table et cliquez sur le bouton puis remplacez les noms par défaut des règles par ceux de votre choix.
    Vous pouvez également utiliser les flèches de la boîte de dialogue pour modifier l'ordre des règles et décider de la règle à exécuter en premier.
  6. Cliquez sur OK.
    Les règles sont renommées et ordonnées comme défini dans la table Matching Key.
  7. Sauvegardez les paramètres de la règle de rapprochement.
    La règle de rapprochement est sauvegardée et centralisée sous le nœud Libraries > Rule > Match dans l'arborescence DQ Repository.