Créer et définir une règle de rapprochement

Exemples de gestion de données maître (Master Data Management)

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Data Fabric
Talend MDM Platform
task
Gouvernance de données > Validation de données
Qualité et préparation de données > Rapprochement de données
Qualité et préparation de données > Dédoublonnage de données
EnrichPlatform
Talend MDM Server
Talend MDM Web UI
Studio Talend
Talend Data Stewardship

Dans ce scénario, vous devez créer et définir une règle de rapprochement MatchCustomer afin de rapprocher les enregistrements de données en préparation appartenant à l'entité Customer et vous basant sur les champs fname et lname.

Dans MDM, les règles de rapprochement sont utilisées pour décider si plusieurs enregistrements correspondent et comment les gérer si c'est le cas.

Procédure

  1. Dans la vue MDM Repository, cliquez-droit sur Match Rule et sélectionnez New dans le menu contextuel.
  2. Dans la boîte de dialogue qui s'ouvre, saisissez un nom pour la nouvelle règle de rapprochement.
    Si nécessaire, saisissez l'objectif dans le champ Purpose et une Description, afin de décrire au mieux votre règle de rapprochement.
  3. Cliquez sur Finish pour fermer la boîte de dialogue.
    La nouvelle règle de rapprochement s'affiche sous le nœud Match Rule. Vous devez définir les caractéristiques de la règle de rapprochement dans l'éditeur Match Rule Editor qui s'ouvre.
  4. Dans la zone Record linkage algorithm, sélectionnez T-Swoosh.
    Vous pouvez utiliser l'algorithme T-Swoosh afin de trouver les doublons et définir comment sont fusionnés deux enregistrements similaires pour créer un enregistrement maître, à l'aide d'une fonction de consolidation.
  5. Dans la zone Match and Survivor, définissez les critères à utiliser lors du rapprochement d'enregistrements de données en préparation.
    Dans cet exemple, ajoutez deux clés de rapprochement Firstname et Lastname, sélectionnez Jaro-Winkler comme fonction de rapprochement, configurez les deux seuils à 0.8 et sélectionnez Longest (for strings) comme fonction de consolidation.
  6. Dans la zone Default Survivorship Rules, définissez comment consolider les correspondances pour certains types de données : Boolean, Number et Date.
    Si vous ne spécifiez pas de comportement pour tous les types de données, le comportement par défaut est appliqué.
    Une fois la règle de rapprochement définie, vous devez l'attacher à une entité spécifique d'un modèle de données.
    Vous ne pouvez déployer une règle de rapprochement directement sur le serveur MDM. Les règles de rapprochement sont déployées avec le modèle de données auquel elles sont attachées.