Exécuter le Job - 7.0

Deduplication

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
EnrichPlatform
Studio Talend

Le composant tLogRow est utilisé pour présenter les résultats d'exécution du Job. Vous pouvez configurer le mode d'affichage dans sa vue Component.

Pour ce faire, double-cliquez sur le tLogRow afin d'ouvrir sa vue Component et, dans la zone Mode, cochez la case Table (print values in cells of a table).

Pour exécuter ce Job, appuyez sur F6.

Cela fait, la vue Run est automatiquement ouverte, dans laquelle vous pouvez visualiser les résultats d'exécution.

Vous pouvez voir que la dernière ligne est l'enregistrement consolidé (survivor) car la colonne SURVIVOR indique true. Cet enregistrement se compose des données de meilleure qualité de chaque colonne des quatre autres lignes, qui sont les doublons des mêmes groupes.

La colonne CONFLICT présente les colonnes contenant plus d'une valeur de champ conforme aux règles de validation données. Prenez l'exemple de la colonne credibility : outre l'enregistrement consolidé dont la crédibilité est de 5.0, la colonne CONFLICT indique que la crédibilité du deuxième enregistrement GRIZZARD est de 4.0, c'est-à-dire qu'elle est supérieure à 3, le seuil configuré dans les règles définies. Cependant, comme une crédibilité de 5.0 apparaît dans la premier enregistrement GRIZZARD CO., le composant tRuleSurvivorship le sélectionne comme étant de la meilleure qualité.