Générer un modèle de rapprochement - 7.0

Matching with machine learning

EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
Talend Data Stewardship
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique

Ce scénario s'applique uniquement aux solutions Talend Platform avec Big Data et Talend Data Fabric nécessitant une souscription.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Le composant tMatchModel lit l'échantillon de paires suspectes généré par le tMatchPairing et manuellement libellé par vos soins.

Le tMatchModel génère plusieurs modèles de rapprochement, cherche automatiquement la meilleure combinaison des paramètres d'apprentissage et conserve le meilleur modèle de rapprochement sortant des résultats de la validation croisée.

Le scénario décrit ici utilise les composants suivants :

  • un composant tFileInputDelimited lisant le fichier source contenant les paires de données suspectes générées par le tMatchPairing,

  • un composant tMatchModel générant les caractéristiques depuis les enregistrements suspects, implémentant l'algorithme Random Forest et créant un modèle de classification.