Correspondance floue entre deux colonnes et écriture en sortie des données principales et rejetées - Cloud - 8.0

Rapprochement flou (Fuzzy matching)

Version
Cloud
8.0
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Last publication date
2023-08-28
Déprécié·e : Le composant tFuzzyJoin est déprécié depuis la version 7.3 (GA, généralement disponible).

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Ce composant est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Ce scénario décrit un Job comprenant cinq composants, ayant pour but : en premier lieu, de vérifier la distance d'édition entre la colonne IdClient d'un fichier d'entrée, par rapport aux données du fichier de référence d'entrée, et, ensuite, de vérifier tous les e-mails par prononciation dans la colonne Email, par rapport aux données du fichier d'entrée de référence. Les sorties de ces deux types de correspondances sont écrits dans des fichiers distincts.

Dans ce scénario, vous avez déjà stocké les schémas d'entrée et les fichiers de référence dans le Repository. Pour plus d'informations concernant le stockage des schémas de métadonnées dans la vue Repository, consultez Gestion des métadonnées dans le Studio.