Scénario : Transformer une liste de fichiers en flux de données - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le scénario suivant décrit un Job permettant de faire une boucle sur une liste de fichiers, de récupérer leur nom, ainsi que la date en cours, pour ensuite transformer ces données en un flux qui sera affiché dans la console.

  • Cliquez et déposez les composants suivants : tFileList, tIterateToFlow et tLogRow.

  • Connectez le tFileList au tIterateToFlow à l'aide d'un lien Iterate et connectez le Job au composant tLogRow à l'aide d'un lien Row Main.

  • Dans la vue Component du composant tFileList, donnez le chemin d'accès au répertoire contenant la liste de fichiers.

  • Dans cet exemple, les fichiers sont trois fichiers .txt simples stockés dans le répertoire Countries.

  • Dans la liste Case sensitive, sélectionnez No (Non) pour ne pas tenir compte de la casse.

  • Sélectionnez le composant tIterateToFlow et cliquez sur Edit Schema pour modifier le nouveau schéma.

  • Ajoutez deux nouvelles colonnes : Filename de type String et Date de type date. Assurez-vous d'avoir paramétré le bon modèle en Java.

  • Cliquez sur OK pour valider.

  • Une boîte de dialogue s'ouvre et vous demande si vous souhaitez propager les changements. Cliquez sur Yes (Oui).

  • Notez que ce nouveau schéma apparaît dans le tableau Mapping.

  • Dans chaque cellule de la colonne Value, appuyez sur Ctrl+Espace pour accéder à la liste des variables globales et à celles que vous avez définies.

  • Pour la colonne Filename, utilisez la variable globale : tFileList_1CURRENT_FILEPATH. Elle reprend le chemin d'accès courant pour recueillir le nom de chaque fichier, le Job fait une boucle sur ce répertoire.

  • Pour la colonne Date, utilisez la routine Talend : TalendDate.getCurrentDate().

  • Dans la vue Component du composant tLogRow, cochez la case Print values in cells of a table.

  • Enregistrez votre Job et exécutez-le, en appuyant sur F6.

Le chemin d'accès apparaît dans la colonne Filename et la date en cours apparaît dans la colonne Date.