Transformer une liste de fichiers en flux de données - 6.4

Orchestration (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Orchestration (Intégration)
Gouvernance de données > Systèmes tiers > Composants Orchestration (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Orchestration (Intégration)
EnrichPlatform
Studio Talend

Le scénario suivant décrit un Job permettant de faire une boucle sur une liste de fichiers, de récupérer leur nom, ainsi que la date en cours, pour ensuite transformer ces données en un flux qui sera affiché dans la console.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

  • Cliquez et déposez les composants suivants : tFileList, tIterateToFlow et tLogRow.

  • Connectez le tFileList au tIterateToFlow à l'aide d'un lien Iterate et connectez le Job au composant tLogRow à l'aide d'un lien Row Main.

  • Dans la vue Component du composant tFileList, donnez le chemin d'accès au répertoire contenant la liste de fichiers.

  • Dans cet exemple, les fichiers sont trois fichiers .txt simples stockés dans le répertoire Countries.

  • Dans la liste Case sensitive, sélectionnez No (Non) pour ne pas tenir compte de la casse.

  • Sélectionnez le composant tIterateToFlow et cliquez sur Edit Schema pour modifier le nouveau schéma.

  • Ajoutez deux nouvelles colonnes : Filename de type String et Date de type date. Assurez-vous d'avoir paramétré le bon modèle en Java.

  • Cliquez sur OK pour valider.

  • Une boîte de dialogue s'ouvre et vous demande si vous souhaitez propager les changements. Cliquez sur Yes (Oui).

  • Notez que ce nouveau schéma apparaît dans le tableau Mapping.

  • Dans chaque cellule de la colonne Value, appuyez sur Ctrl+Espace pour accéder à la liste des variables globales et à celles que vous avez définies.

  • Pour la colonne Filename, utilisez la variable globale : tFileList_1CURRENT_FILEPATH. Elle reprend le chemin d'accès courant pour recueillir le nom de chaque fichier, le Job fait une boucle sur ce répertoire.

  • Pour la colonne Date, utilisez la routine Talend  : Talend Date.getCurrentDate().

  • Dans la vue Component du composant tLogRow, cochez la case Print values in cells of a table.

  • Enregistrez votre Job et exécutez-le, en appuyant sur F6.

Le chemin d'accès apparaît dans la colonne Filename et la date en cours apparaît dans la colonne Date.