Créer et définir une règle de rapprochement - 8.0

Exemples de gestion de données maître (Master Data Management)

Version
8.0
Language
Français
Operating system
MDM Platform
Product
Talend Data Fabric
Talend MDM Platform
Module
Studio Talend
Talend Data Stewardship
Talend MDM Server
Talend MDM Web UI
Content
Gouvernance de données > Validation de données
Qualité et préparation de données > Dédoublonnage de données
Qualité et préparation de données > Rapprochement de données
Last publication date
2023-01-12

Dans ce scénario, vous devez créer et définir une règle de rapprochement MatchCustomer afin de rapprocher les enregistrements de données en préparation appartenant à l'entité Customer et vous basant sur les champs fname et lname.

Dans MDM, les règles de rapprochement sont utilisées pour décider si au moins deux enregistrements de données correspondent et dans ce cas, comment les gérer.

Procédure

  1. Dans la vue MDM Repository, cliquez-droit sur Match Rule puis sélectionnez New dans le menu contextuel.
  2. Dans la boîte de dialogue qui s'ouvre, saisissez un nom pour la nouvelle règle de rapprochement.
    Si nécessaire, saisissez l'objectif dans le champ Purpose et une Description, afin de décrire au mieux votre règle de rapprochement.
  3. Cliquez sur Finish afin de fermer la boîte de dialogue.
    La nouvelle règle de rapprochement s'affiche sous le nœud Match Rule. Vous devez définir les caractéristiques de la règle de rapprochement dans l'éditeur Match Rule Editor qui s'ouvre.
  4. Dans la zone Record linkage algorithm, sélectionnez T-Swoosh.
    Vous pouvez utiliser l'algorithme T-Swoosh afin de trouver les doublons et définir comment sont fusionnés deux enregistrements similaires pour créer un enregistrement maître, à l'aide d'une fonction de consolidation.
  5. Dans la zone Match and Survivor, définissez les critères à utiliser lors du rapprochement d'enregistrements de données en préparation.
    Dans cet exemple, ajoutez deux clés de rapprochement Firstname et Lastname, sélectionnez Jaro-Winkler comme fonction de rapprochement, configurez les deux seuils à 0.8 et sélectionnez Longest (for strings) comme fonction de consolidation.
  6. Dans la zone Default Survivorship Rules, définissez comment consolider les correspondances pour certains types de données : Boolean, Number et Date.
    Si vous ne spécifiez pas de comportement pour tous les types de données, le comportement par défaut est appliqué.
    Une fois la règle de rapprochement définie, vous devez la joindre à une entité spécifique d'un modèle de données.
    Vous ne pouvez déployer une règle de rapprochement directement sur le serveur MDM. Les règles de rapprochement sont déployées avec le modèle de données auquel elles sont attachées.