Scénario 1 : Itération sur un répertoire - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le scénario suivant décrit un Job de trois composants, qui a pour objectif de répertorier les fichiers d'un répertoire donné, de lire chaque fichier par itération, de sélectionner les données délimitées et d'afficher ces données en sortie dans la console Run.

Déposer et relier les composants

  1. Cliquez et déposez les composants suivants : tFileList, tFileInputDelimited et tLogRow dans l'espace de modélisation.

  2. Cliquez-droit sur le composant tFileList et connectez-le au composant tFileInputDelimited via une connexion de type Row Iterate. Puis connectez le tFileInputDelimited au tLogRow à l'aide d'une connexion de type Row Main.

Configurer les composants

  1. Sélectionnez le composant tFileList et cliquez sur l'onglet Basic settings :

  2. Dans le champ Directory, indiquez le chemin d'accès des fichiers à traiter. Pour faire apparaître ce chemin d'accès dans le Job lui-même, utilisez le nom de champ (__DIRECTORY__) qui apparaît en bulle info lorsque vous passez le souris sur le champ Directory. Saisissez cette référence dans le champ Label Format de l'onglet View.

  3. Dans le champ FileList Type, sélectionnez l'option Files.

  4. Définissez le champ Case sensitive sur Yes pour prendre la casse en compte dans cet exemple.

  5. Laissez la case Use Glob Expressions as Filemask cochée si vous utilisez des expressions globales pour filtrer les fichiers et définissez un masque de fichier dans le champ Filemask.

  6. Double-cliquez sur le tFileInputDelimited afin d'ouvrir sa vue Basic settings et définissez ses propriétés.

  7. Dans le champ File Name, nommez le fichier à l'aide d'une variable contenant son chemin d'accès, tel que vous l'avez renseigné dans les propriétés du tFileList. Appuyez sur Ctrl+Espace pour accéder à la liste d'autocomplétion des variables et sélectionnez la variable globale ((String)globalMap.get("tFileList_1_CURRENT_FILEPATH")).

  8. Renseignez les autres champs comme pour un fichier délimité tFileInputDelimited standard. Voir également : tFileInputDelimited.

  9. Sélectionnez le composant de sortie tLogRow et renseignez le séparateur de champs qui s'affichera dans la console de l'onglet Run. Voir également : Propriétés du tLogRow.

Sauvegarder et exécuter le Job

Appuyez sur Ctrl+S pour sauvegarder votre Job et appuyez sur F6 pour l'exécuter.

L'itération s'effectue sur le répertoire défini. Chacun des fichiers contenus dans ce répertoire est lu. Puis les données délimitées sont transmises au composant de sortie qui les affiche dans la console Log de la vue Run.