Scénario : Transformer un flux de données en liste - 6.3

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le scénario suivant décrit un Job permettant de lire une liste de fichiers à partir d'un fichier d'entrée donné. Il effectue également une itération sur chacun des fichiers et affiche leur contenu ligne par ligne dans la console de log Run.

Construire le Job

  1. A partir de la Palette, cliquez-déposez les composants suivants dans l'espace de modélisation : deux tFileInputDelimited, un tFlowToIterate et un tLogRow.

  2. Cliquez-droit sur chacun des composants pour les relier entre eux. Connectez le premier tFileInputDelimited au tFlowToIterate à l'aide d'un lien de type Row Main, puis le tFlowToIterate au deuxième tFileInputDelimited à l'aide d'un lien de type Iterate, enfin le second tFileInputDelimited au tLogRow à l'aide d'un lien de type Row Main.

Configurer les composants

  1. Dans l'espace de modélisation graphique, double-cliquez sur le premier tFileInputDelimited pour afficher sa vue Component.

  2. Dans l'onglet Basic settings, cliquez sur le bouton [...] situé à côté du champ File Name pour déterminer le chemin d'accès au fichier d'entrée.

    Note

    Le champ File Name est obligatoire.

    Le fichier d'entrée utilisé dans ce scénario est Customers. Il s'agit d'un fichier texte contenant trois autres fichiers texte simples : Name, E-mail et Address. Le fichier Name est constitué d'une colonne contenant le nom des clients et le fichier E-mail d'une colonne contenant l'adresse email de ces clients. Le troisième fichier texte, Address, est composé d'une colonne comprenant l'adresse postale des clients.

    Renseignez les autres champs en fonction de votre fichier. Pour plus d'informations sur le tFileInputDelimited, consultez Propriétés du tFileInputDelimited. Dans ce scénario, l'en-tête, le pied de page et le nombre limite de lignes à traiter ne sont pas définis. Donc, laissez les champs Header (en-tête) et Footer (pied de page) et Limit par défaut.

  3. Cliquez sur le bouton Edit schema pour décrire la structure des données du fichier d'entrée. Dans ce scénario, le schéma comporte une seule colonne appelée FileName.

  4. Dans l'espace de modélisation graphique, sélectionnez le tFlowToIterate et cliquez sur l'onglet Component pour définir sa configuration de base (Basic settings).

    Cliquez sur le bouton [+] pour ajouter des lignes de paramètres et définissez vos variables. Cliquez dans la cellule key afin de saisir le nom de la variable souhaité. Dans ce scénario, la variable est la suivante : "Name_of_File".

    Vous pouvez également cocher la case Use the default (key, value) in global variables pour utiliser la valeur par défaut des variables globales.

  5. Dans l'espace de modélisation graphique, double-cliquez sur le second composant tFileInputDelimited pour ouvrir sa vue Component.

    Dans le champ File Name, renseignez le répertoire des fichiers à lire puis appuyez sur les touches Ctrl+Espace pour sélectionner la variable globale "Name_of_File". Dans ce scénario, la syntaxe est la suivante :

    "C:/scenario/flow_to_iterate/"+((String)globalMap.get("Name_of_File"))

    Cliquez sur Edit schema afin de définir le nom de la colonne du schéma. Nommez-la, dans ce scénario, RowContent.

    Renseignez les autres champs selon vos besoins. Pour plus d'informations, consultez Propriétés du tFileInputDelimited.

  6. Dans l'espace de modélisation graphique, double-cliquez sur le dernier composant, le tLogRow, pour afficher sa vue Component et définir sa configuration de base (Basic settings).

    Définissez les paramètres selon vos besoins. Pour plus d'informations, consultez Propriétés du tLogRow.

Sauvegarder et exécuter le Job

  1. Enregistrez votre Job en appuyant sur les touches Ctrl+S.

  2. Appuyez sur F6 pour l'exécuter ou cliquez sur le bouton Run dans la vue Run.

La console affiche, pour chaque ligne, le nom du client, son e-mail et son adresse, précédés du nom de la colonne du schéma.