Scénario : Remplacement à partir d'un fichier de référence - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le Job suivant recherche et remplace une liste d'états par le code à deux lettres correspondant. Les codes correspondants proviennent d'un fichier de référence placé dans le flux lookup du Job.

Construire le Job

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : deux tFileInputDelimited, un tReplaceList et un tLogRow.

  2. Reliez les deux tFileInputDelimited au tReplaceList à l'aide de liens Row > Main. Notez que le lien entre le composant de référence (le second tFileInputDelimited) et le tReplaceList apparaît comme lien Lookup.

  3. Reliez le composant tReplaceList au tLogRow à l'aide d'un lien Row > Main.

Configurer les composants

  1. Double-cliquez sur le premier tFileInputDelimited pour ouvrir sa vue Basic settings et configurer les paramètres du flux d'entrée principal, notamment le chemin d'accès au fichier à lire, ainsi que le nombre de lignes d'en-tête à ignorer.

    Dans cet exemple, le fichier principal d'entrée fournit une liste de personnes et d'états des Etats-Unis. Voici un extrait du fichier :

    name;state
    Andrew Kennedy;Mississippi
    Benjamin Carter;Louisiana
    Benjamin Monroe;West Virginia
    Bill Harrison;Tennessee
    Calvin Grant;Virginia
    Chester Harrison;Rhode Island
    Chester Hoover;Kansas
    Chester Kennedy;Maryland
    Chester Polk;Indiana
    Dwight Nixon;Nevada
    Dwight Roosevelt;Mississippi
    Franklin Grant;Nebraska
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue [Schema] et configurer le schéma d'entrée.

    Selon la structure du fichier d'entrée principal, le schéma d'entrée doit contenir deux colonnes : name et state.

    Cliquez sur OK pour fermer la boîte de dialogue et propager les modifications au composant suivant.

  3. Configurez de la même façon les propriétés du second tFileInputDelimited.

    Dans cet exemple, le fichier de référence fournit une liste d'états ainsi que leur code à deux lettres. Le schéma de référence doit donc comprendre deux colonnes : state et code.

  4. Double-cliquez sur le tReplaceList pour ouvrir sa vue Basic settings et paramétrer l'opération à effectuer.

  5. Dans la liste Lookup search column, sélectionnez la colonne à rechercher. Dans ce scénario, recherchez la colonne state.

  6. Dans la liste Lookup replacement column, sélectionnez la colonne contenant les valeurs de remplacement, code pour les codes à deux lettres des états, dans cet exemple.

  7. Dans la table Column options, cochez la case Replace pour la colonne states, afin de remplacer le nom des états par le code correspondant.

  8. Dans le composant tLogRow, sélectionnez l'option Table pour une meilleure lisibilité de la sortie.

Exécuter le Job

  • Sauvegardez le Job et appuyez sur F6 pour l'exécuter.

    Le nom des états a été remplacé par le code à deux lettres correspondant.