Exécuter le Job - 7.0

Identification

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants d'identification
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants d'identification
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants d'identification
EnrichPlatform
Studio Talend

Procédure

Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.
Les colonnes de sortie incluent la colonne T_GEN_KEY contenant la clé fonctionnelle générée par le composant tGenKey. Vous pouvez constater que tous les enregistrements ayant la même clé fonctionnelle sont regroupés en groupes de blocs différents. Tous les enregistrements ayant la même clé fonctionnelle sont partitionnés en groupes de blocs. L'identifiant de chaque groupe est affiché dans la colonne GID à côté de l'enregistrement correspondant. Le nombre d'enregistrements dans chacun des blocs de sortie est listé dans la colonne GRP_SIZE et calculé uniquement sur l'enregistrement maître. La colonne MASTER indique par true/false si l'enregistrement correspondant est un enregistrement maître ou non. La colonne SCORE affiche la distance calculée entre l'enregistrement d'entrée et l'enregistrement maître selon l'algorithme de correspondance Jaro-Winkler.
Pour un exemple sur la création de partitions de données basées sur différentes clés de bloc, ainsi que sur leur utilisation avec plusieurs composants tMatchGroup, consultez tMatchGroup.