Exécuter le Job pour libeller des paires suspectes avec des libellés assignés - 7.3

Rapprochement de données à l'aide des outils Talend

Version
7.3
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Last publication date
2024-02-07

Procédure

Appuyez sur F6 pour exécuter le Job.

Résultats

tMatchPredict libelle les paires suspectes, groupe les enregistrements suspects correspondant au libellé YES et écrit toutes les paires suspectes dans le fichier de sortie.

Les enregistrements suspects correspondant au libellé YES appartiennent aux groupes car le tMatchPredict a été configuré pour regrouper les enregistrements correspondant à cette classe de clustering.

Les enregistrements correspondant au libellé NO n'appartiennent à aucun groupe.

Que faire ensuite

Vous pouvez maintenant créer une représentation unique de chaque groupe de doublons et les fusionner avec les enregistrements uniques calculés par le tMatchPairing.

Pour un exemple de création d'un jeu de données propres et dédoublonnées, consultez Créer un jeu de données nettoyées à partir des paires suspectes libellées par le tMatchPredict et les enregistrements uniques calculés par le tMatchPairing.

Vous trouverez un exemple de création d'un jeu de données propres et dédoublonnées sur Talend Help Center (https://help.talend.com).