Définir une clé de rapprochement - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Procédure

  1. Dans l'éditeur de règle et dans la table Matching Key, cliquez sur le bouton [+] pour ajouter une ligne à la table.
  2. Configurez les paramètres de la clé de rapprochement comme suit:
    • Match Key Name : saisissez le nom de votre choix pour la clé de rapprochement.

    • Matching Function : sélectionne dans la liste le type de rapprochement à effectuer. Sélectionnez Custom si vous souhaitez utiliser un algorithme externe personnalisé.

      Utilisez les méthodes de rapprochement Levenshtein et Jaro-Winkler sur les prénoms et noms de famille, respectivement et récupérez les enregistrements en doublon.

    • Customer Matcher : cet élément est utilisable uniquement avec la fonction de consolidation Custom. Parcourez votre système et sélectionnez le fichier Jar de l'algorithme personnalisé.

    • Confidence Weight : configure un poids numérique (entre 1 et 10) sur la colonne que vous souhaitez utiliser comme clé de rapprochement. Cette valeur est utilisée pour donner plus ou moins d'importance à certaines colonnes lors du rapprochement.

    • Handle Null : spécifie comment traiter les enregistrements de données contenant des valeurs nulles.

    Pour plus d'informations concernant les paramètres des règles de rapprochement, consultez la documentation du tMatchGroup.
  3. Dans le champ Match threshold, saisissez le seuil de probabilité de rapprochement Deux enregistrements de données correspondent lorsque leur probabilité est supérieure à cette valeur.
    Dans le champ Confident match threshold, configurez une valeur numérique comprise entre la valeur du champ Match threshold et 1. Au-dessus de ce seuil, vous pouvez avoir confiance en la qualité du groupe.
  4. Pour définir une seconde règle de rapprochement, placez votre curseur dans le coin supérieur droit de la table Matching Key et cliquez sur le bouton [+].
    Suivez les étapes pour créer une règle de rapprochement.
    Lorsque vous définissez de multiples conditions dans l'éditeur de règle de rapprochement, une opération de rapprochement OR est effectuée sur les données analysées. Les enregistrements sont évalués par rapport à la première règle.
  5. Facultatif : Pour remplacer les noms par défaut des règles, placez votre curseur dans le coin supérieur droit de la table et cliquez sur le bouton .
    Vous pouvez également utiliser les flèches de la boîte de dialogue pour modifier l'ordre des règles et décider de la règle à exécuter en premier.
  6. Cliquez sur OK.
    Les règles sont renommées et ordonnées comme défini dans la table Matching Key.
  7. Sauvegardez les paramètres de la règle de rapprochement.
    La règle de rapprochement est sauvegardée et centralisée sous le nœud Libraries > Rule > Match dans l'arborescence DQ Repository.