Configurer les composants - Cloud - 8.0

Rapprochement de données à l'aide des outils Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Création et développement > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement continu
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement de données
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement flou
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de rapprochement > Composants de rapprochement utilisant l'apprentissage automatique
Last publication date
2024-02-07

Procédure

  1. Configurez les paramètres du composant tFixedFlowInput dans sa vue Basic settings.
    Dans cet exemple, vous utilisez l'entrée suivante :
    FirstName;Name
    Brad;Los angeles
    Jason;New York
    Margaret;
    Kourtney;Seattle
    Nicole;Saint-Louis
    John;Denver
  2. Définissez le schéma du composant. Dans cet exemple, le schéma d'entrée possède deux colonnes, FirstName et City.
  3. Configurez le second tFixedFlowInput.
    Dans cet exemple, vous utilisez l'entrée suivante :
    FirstName;City
    Brad;Los Angeles
    Jason;New York
    Margaret;Dallas
    Courtney;Seattle
    Nicole;Saint-Louis
    Jon;Denver
  4. Assurez-vous que la colonne de référence a bien été définie comme colonne clé dans le schéma du flux de référence (lookup).
  5. Double-cliquez sur le tFuzzyMatch pour ouvrir sa vue Basic settings et vérifiez son schéma.
    Le Schema doit correspondre à celui du flux d'entrée principal (Main) afin que le flux principal soit comparé au flux de référence.
    Notez que deux colonnes : Value et Matching sont ajoutées au schéma de sortie. Elles correspondent à des informations standards de correspondance et sont en lecture seule.
  6. Sélectionnez la méthode à utiliser pour la vérification des données entrantes. Dans ce scénario, Levenshtein est le type de correspondance (Matching type) devant être utilisé.
  7. Configurez la distance.
    Dans cette méthode, la distance est le nombre de caractères modifiés (insertion, suppression ou substitution) pour que l'entrée principale corresponde exactement à l'entrée de référence.
    Dans cet exemple, configurez la distance minimale et la distance maximale à 0. Ce qui signifie que seule une correspondance exacte sera redirigée en flux de sortie.
  8. Décochez la case Case sensitive (Sensible à la casse).
  9. Sélectionnez la colonne de rapprochement et la colonne de lookup. Sélectionnez la colonne de prénom dans cet exemple.
  10. Laissez les autres paramètres par défaut.