Créer une règle de rapprochement - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

En qualité de données, les règles de rapprochement sont utilisées pour comparer un ensemble de colonnes et créer des groupes d'enregistrements similaires à l'aide de clés de bloc et de clés de rapprochement et/ou de fonctions de consolidation.

Dans la perspective Profiling, vous pouvez créer des règles de rapprochement avec l'algorithme VSR ou T-Swoosh et les sauvegarder dans le référentiel du Studio. Une fois centralisées dans le référentiel, vous pouvez les importer dans l'éditeur d'analyse de rapprochement et les tester sur vos données, afin de grouper les enregistrements en doublon. Pour plus d'informations concernant les analyses de rapprochement, consultez Créer une analyse de rapprochement.

Vous pouvez également importer des règles de rapprochement définies avec l'algorithme VSR dans l'assistant de configuration du composant tMatchGroup et dans d'autres composants de rapprochement, comme les composants Hadoop, et utiliser ces règles dans des Jobs de rapprochement. Pour plus d'informations, consultez la documentation du composant tMatchGroup.

Les deux algorithmes produisent différents résultats de rapprochement pour les raisons suivantes :
  1. L'enregistrement maître est simplement sélectionné pour être le premier enregistrement d'entrée avec l'algorithme VSR. Ainsi, la liste des groupes correspondants dépend donc de l'ordre des enregistrements d'entrée.

  2. Les enregistrements de sortie ne changent pas avec l'algorithme VSR, alors que le T-Swoosh crée de nouveaux enregistrements.