Générer un modèle de rapprochement - 7.0

Matching with machine learning

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
EnrichPlatform
Studio Talend
Talend Data Stewardship

Ce scénario s'applique uniquement aux solutions Talend Platform avec Big Data et Talend Data Fabric nécessitant souscription.

Pour plus d'informations concernant les technologies supportées par Talend, consultez .

Le composant tMatchModel lit l'échantillon de paires suspectes généré par le tMatchPairing et manuellement libellé par vous.

Le tMatchModel génère plusieurs modèles de rapprochement, cherche automatiquement la meilleure combinaison des paramètres d'apprentissage et conserve le meilleur modèle de rapprochement sortant des résultats de la validation croisée.

Le scénario décrit ici utilise les composants suivants :

  • un tFileInputDelimited lisant le fichier source contenant les paires de données suspectes générées par le tMatchPairing,

  • un tMatchModel générant les caractéristiques depuis les enregistrements suspects, implémentant l'algorithme Random Forest et créant un modèle de classification.