Créer et définir une règle de rapprochement - 7.1

Exemples de gestion de données maître (Master data management)

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
Talend MDM Platform
task
Gouvernance de données > Validation de données
Qualité et préparation de données > Dédoublonnage de données
Qualité et préparation de données > Rapprochement de données
EnrichPlatform
Studio Talend
Talend Data Stewardship
Talend MDM Server
Talend MDM Web UI

Dans ce scénario, vous devez créer et définir une règle de rapprochement MatchCustomer afin de rapprocher les enregistrements de données en préparation appartenant à l'entité Customer et vous basant sur les champs fname et lname.

Dans MDM, les règles de rapprochement sont utilisées pour décider si au moins deux enregistrements de données correspondent et dans ce cas, comment les gérer.

Procédure

  1. Dans la vue MDM Repository, cliquez-droit sur Match Rule puis sélectionnez New dans le menu contextuel.
  2. Dans la boîte de dialogue qui s'ouvre, saisissez un nom pour la nouvelle règle de rapprochement.
    Si nécessaire, saisissez l'objectif dans le champ Purpose et une Description, afin de décrire au mieux votre règle de rapprochement.
  3. Cliquez sur Finish afin de fermer la boîte de dialogue.
    La nouvelle règle de rapprochement s'affiche sous le nœud Match Rule. Vous devez définir les caractéristiques de la règle de rapprochement dans l'éditeur Match Rule Editor qui s'ouvre.
  4. Dans la zone Record linkage algorithm, sélectionnez T-Swoosh.
    Vous pouvez utiliser l'algorithme T-Swoosh afin de trouver les doublons et définir comment sont fusionnés deux enregistrements similaires pour créer un enregistrement maître, à l'aide d'une fonction de consolidation.
  5. Dans la zone Match and Survivor, définissez les critères à utiliser lors du rapprochement d'enregistrements de données en préparation.
    Dans cet exemple, ajoutez deux clés de rapprochement Firstname et Lastname, sélectionnez Jaro-Winkler comme fonction de rapprochement, configurez les deux seuils à 0.8 et sélectionnez Longest (for strings) comme fonction de consolidation.
  6. Dans la zone Default Survivorship Rules, définissez comment consolider les correspondances pour certains types de données : Boolean, Number et Date.
    Si vous ne spécifiez pas de comportement pour tous les types de données, le comportement par défaut est appliqué.
    Une fois la règle de rapprochement définie, vous devez l'attacher à une entité spécifique d'un modèle de données.
    Vous ne pouvez déployer une règle de rapprochement directement sur le serveur MDM. Les règles de rapprochement sont déployées avec le modèle de données auquel elles sont attachées.