Configurer les composants - 7.1

Standardization

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le premier tFileInputDelimited pour ouvrir sa vue Basic settings et configurer les paramètres du flux d'entrée principal, notamment le chemin d'accès au fichier à lire, ainsi que le nombre de lignes d'en-tête à ignorer.
    Dans cet exemple, le fichier principal d'entrée fournit une liste de personnes et d'états des États-Unis. Voici un extrait du fichier :
    name;state
    Andrew Kennedy;Mississippi
    Benjamin Carter;Louisiana
    Benjamin Monroe;West Virginia
    Bill Harrison;Tennessee
    Calvin Grant;Virginia
    Chester Harrison;Rhode Island
    Chester Hoover;Kansas
    Chester Kennedy;Maryland
    Chester Polk;Indiana
    Dwight Nixon;Nevada
    Dwight Roosevelt;Mississippi
    Franklin Grant;Nebraska
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue Schema et configurer le schéma d'entrée.
    Selon la structure du fichier d'entrée principal, le schéma d'entrée doit contenir deux colonnes : name et state.
    Cliquez sur OK pour fermer la boîte de dialogue et propager les modifications au composant suivant.
  3. Configurez de la même façon les propriétés du second tFileInputDelimited.
    Dans cet exemple, le fichier de référence fournit une liste d'états ainsi que leur code à deux lettres. Le schéma de référence doit donc comprendre deux colonnes : state et code.
  4. Double-cliquez sur le tReplaceList pour ouvrir sa vue Basic settings et paramétrer l'opération à effectuer.
  5. Dans la liste Lookup search column, sélectionnez la colonne à rechercher. Dans ce scénario, recherchez la colonne state.
  6. Dans la liste Lookup replacement column, sélectionnez la colonne contenant les valeurs de remplacement, code pour les codes à deux lettres des états, dans cet exemple.
  7. Dans la table Column options, cochez la case Replace pour la colonne states, afin de remplacer le nom des états par le code correspondant.
  8. Dans le composant tLogRow, sélectionnez l'option Table pour une meilleure lisibilité de la sortie.