tMatchGroup - 7.0

Data matching

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
EnrichPlatform
Studio Talend

Ce composant crée des groupes d'enregistrements de données similaires dans toute source de données, même les gros volumes, à l'aide d'une ou plusieurs règles de mise en correspondance.

Le tMatchGroup compare des colonnes de flux d'entrée standards et de flux de données M/R en utilisant des méthodes de correspondance définie et regroupe les doublons rencontrés.

Différents composants tMatchGroup peuvent être utilisés en séquence pour rapprocher des données par rapport à différentes clés de blocs. Cela permet d'affiner les groupes reçus par chaque tMatchGroup tout en créant différentes partitions de données contenant des blocs de données de la passe précédente. Vous pouvez répéter cette séquence avec d'autres composants tMatchGroup.

Lors de la définition d'un groupe, le premier enregistrement traité de chaque groupe est l'enregistrement maître du groupe. Les autres enregistrements sont calculés selon leur distance par rapport aux enregistrements maître et sont distribués à l'enregistrement maître correspondant.

Pour plus d'informations concernant les technologies supportées par Talend, consultez .