Ce scénario s'applique uniquement aux solutions Talend Platform avec Big Data et Talend Data Fabric nécessitant souscription.
Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.
Pour plus d'informations concernant les deux workflows utilisés lors d'un rapprochement avec Spark, consultez Rapprochement sur Spark.
Le cas d'utilisation décrit ici utilise :
-
un composant tFileInputDelimited pour lire les paires d'entrée suspectes générées par le tMatchPairing,
-
un composant tMatchPredict pour libeller automatiquement les enregistrements suspects et regrouper les enregistrements suspects correspondant au(x) libellé(s) configurés dans les propriétés du composant,
-
un composant tFileOutputDelimited pour écrire en sortie les enregistrements en doublon libellés et afficher les groupes créés sur les enregistrements suspects correspondant au(x) libellé(s) configuré(s) dans les propriétés du tMatchPredict.