Rapprochement de deux enregistrements - 7.1

Data matching

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
EnrichPlatform
Studio Talend
Vous pouvez utiliser le composant tMatchGroup pour détecter des doublons et définir comment fusionner des enregistrements similaires afin de créer un enregistrement maître.

La création d'un enregistrement maître est un processus itératif : chaque nouvel enregistrement maître peut être utilisé pour trouver de nouveaux doublons.

Vous pouvez choisir entre deux algorithmes différents pour créer des enregistrements maître :

  • Simple VSR Matcher
  • T-Swoosh

La principale différence entre ces deux algorithmes, c'est que T-Swoosh crée, pour chaque enregistrement maître, un enregistrement qui n'existe pas dans la liste des enregistrements en entrée.