Accéder au contenu principal

Comparaison de colonnes et regroupement dans le flux de sortie d'enregistrements en doublon ayant la même clé fonctionnelle

Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend MDM Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Ce second scénario décrit un Job dont le but est de :

  • générer une clé fonctionnelle utilisant un algorithme sur l'une des colonnes d'entrée, DoB tel que décrit dans le scénario 1 ;

  • mettre en correspondance les deux colonnes d'entrée à l'aide de l'algorithme Jaro-Winkler ;

  • regrouper les colonnes de sortie via la clé fonctionnelle générée afin d'optimiser l'opération de mise en correspondance et comparer uniquement les enregistrements ayant la même valeur de bloc, la clé fonctionnelle dans ce scénario. Pour plus d'informations concernant le regroupement des colonnes de sortie et l'utilisation des valeurs de bloc, consultez tMatchGroup.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !