Exécuter le Job - 7.3

Identification

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants d'identification
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants d'identification
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants d'identification
Last publication date
2024-02-22

Procédure

Enregistrez votre Job et appuyez sur F6 pour l'exécuter.
Les colonnes de sortie incluent la colonne T_GEN_KEY contenant la clé fonctionnelle générée par le composant tGenKey.
Vous pouvez constater que tous les enregistrements ayant la même clé fonctionnelle sont regroupés en groupes de blocs différents. L'identifiant de chaque groupe est affiché dans la colonne GID à côté de l'enregistrement correspondant. Le nombre d'enregistrements dans chacun des blocs de sortie est listé dans la colonne GRP_SIZE et calculé uniquement sur l'enregistrement maître. La colonne MASTER indique par true/false si l'enregistrement correspondant est un enregistrement maître ou non. La colonne SCORE affiche la distance calculée entre l'enregistrement d'entrée et l'enregistrement maître selon l'algorithme de correspondance Jaro-Winkler.
Pour un exemple de création de partitions de données basées sur différentes clés de bloc, ainsi que de leur utilisation avec plusieurs composants tMatchGroup, consultez tMatchGroup.