Libeller des paires suspectes avec des libellés assignés - 7.0

Matching with machine learning

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
EnrichPlatform
Studio Talend
Talend Data Stewardship

Ce scénario s'applique uniquement aux solutions Talend Platform avec Big Data et Talend Data Fabric nécessitant souscription.

Pour plus d'informations concernant les technologies supportées par Talend, consultez .

Pour plus d'informations concernant les deux workflows utilisés lors d'un rapprochement avec Spark, consultez Rapprochement sur Spark.

Le cas d'utilisation décrit ici utilise :

  • un composant tFileInputDelimited pour lire les paires d'entrée suspectes générées par le tMatchPairing,

  • un composant tMatchPredict pour libeller automatiquement les enregistrements suspects et regrouper les enregistrements suspects correspondant au(x) libellé(s) configurés dans les propriétés du composant,

  • un composant tFileOutputDelimited pour écrire en sortie les enregistrements en doublon libellés et afficher les groupes créés sur les enregistrements suspects correspondant au(x) libellé(s) configuré(s) dans les propriétés du tMatchPredict.