Exécuter le Job pour calculer les paires suspectes et l'échantillon suspect - 7.0

Matching with machine learning

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
EnrichPlatform
Studio Talend
Talend Data Stewardship

Procédure

Appuyez sur F6 pour exécuter le Job.

Résultats

Le composant tMatchPairing calcule les paires d'enregistrements suspects et l'échantillon de paires, en se basant sur la définition de la clé de bloc, puis écrit les résultats dans des fichiers de sortie.

Le tMatchPairing exclut les lignes uniques et les écrit dans le fichier de sortie :

Le tMatchPairing exclut les doublons exacts et les écrit dans la vue Run :

Ce composant a ajouté une colonne en lecture seule, LABEL, pour le lien Pairs sample.

Que faire ensuite

Vous pouvez utiliser la colonne LABEL pour libeller les enregistrements suspects manuellement, avant de les utiliser avec le composant tMatchModel.

Pour un exemple de génération de modèle de rapprochement à l'aide du tMatchModel, consultez Générer un modèle de rapprochement.