Construire le Job - 7.1

Fuzzy matching

author
Talend Documentation Team
EnrichVersion
Cloud
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
EnrichPlatform
Studio Talend

Procédure

  1. Dans l'arborescence du Repository, développez les nœuds Metadata puis File Excel où vous avez stocké le schéma principal d'entrée, puis glissez-les dans l'espace de modélisation graphique.

    Un composant tFileInputExcel contenant votre schéma s'affiche dans l'espace de modélisation.

  2. Répétez l'opération avec le schéma d'entrée de référence afin d'afficher un tFileInputExcel contenant le schéma de référence, dans l'espace de modélisation graphique.
  3. Déposez un tBlockedFuzzyJoin et trois tLogRow de la Palette dans l'espace de modélisation graphique.
  4. Connectez les fichiers Excel principal et de référence d'entrée au tBlockedFuzzyJoin à l'aide de lien Row > Main. Le lien entre le fichier de référence Excel d'entrée et le tBlockedFuzzyJoin s'affiche dans l'espace de modélisation comme un lien Lookup.
  5. Connectez le tBlockedFuzzyJoin aux trois composants tLogRow en utilisant les liens Matches, Possible Matches et Non Matches.