Finaliser le Job et l'exécuter - 7.1

Data matching

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tLogRow pour afficher sa vue Basic settings et définir ses propriétés.
  2. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.
    Les enregistrements similaires sont regroupés. Le nombre d'enregistrements dans chaque groupe est listé dans la colonne GRP_SIZE et calculé uniquement sur l'enregistrement maître. La colonne MASTER indique à l'aide de true ou false si l'enregistrement correspondant est un enregistrement maître ou non. L'enregistrement maître est créé par fusion de l'enregistrement correspondant le mieux à l'algorithme phonétique et de l'enregistrement ayant la valeur d'âge la plus élevée. La colonne SCORE affiche la similarité calculée entre l'enregistrement d'entrée et l'enregistrement maître selon l'algorithme de rapprochement Soundex.
    L’identifiant pour chaque groupe, de type String, est listé dans la colonne GID à côté de l'enregistrement correspondant. Cet identifiant est de type Long pour les Jobs migrés à partir d'anciennes versions du studio. Pour avoir un identifiant de groupe de type String, vous devez remplacer le composant tMatchGroup dans le Job importé par un tMatchGroup, depuis la Palette.