Exécuter le Job pour libeller des paires suspectes avec des libellés assignés - 7.0

Matching with machine learning

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
EnrichPlatform
Studio Talend
Talend Data Stewardship

Procédure

Appuyez sur F6 pour exécuter le Job.

Résultats

tMatchPredict libelle les paires suspectes, groupe les enregistrements suspects correspondant au libellé YES et écrit toutes les paires suspectes dans le fichier de sortie.

Les enregistrements suspects correspondant au libellé YES appartiennent à des groupes car le tMatchPredict a été configuré pour grouper les enregistrements correspondant à cette classe de regroupement.

Les enregistrements correspondant au libellé NO n'appartiennent à aucun groupe.

Que faire ensuite

Vous pouvez maintenant créer une représentation unique de chaque groupe de doublons et les fusionner avec les enregistrements uniques calculés par le tMatchPairing.

Pour un exemple de création d'un jeu de données propres et dédoublonnées, consultez Créer un jeu de données nettoyées à partir des paires suspectes libellées par le tMatchPredict et les enregistrements uniques calculés par le tMatchPairing.