Ce scénario s'applique uniquement aux solutions Talend Platform avec Big Data et Talend Data Fabric nécessitant souscription.
Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.
Le tMatchModel lit l'échantillon de paires suspectes calculé à partir d'une liste de centres d'éducation de la petite enfance en doublon et libellé par des arbitres de données dans Talend Data Stewardship. Il génère plusieurs modèles de rapprochement, recherche la meilleure combinaison pour les paramètres d'apprentissage et conserve le meilleur modèle de rapprochement sortant des résultats de la validation croisée.
- Vous devez avoir généré les paires de données suspectes en utilisant le
tMatchPairing et les avoir libellées dans Talend Data Stewardship. Pour plus
d'informations, consultez Calculer des paires suspectes et écrire un échantillon dans Talend Data Stewardship.
Pour plus d'informations concernant les tâches de regroupement, consultez Gérer des tâches de regroupement pour décider des relations entre les paires d'enregistrements.