Scénario : Itération sur des fichiers et fusion de contenu - 6.3

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le Job suivant effectue une itération sur une liste de fichiers puis fusionne leur contenu et affiche le contenu final des deux colonnes dans la console.

Déposer et relier les composants

  1. Cliquez et déposez les composants suivants dans l'espace de modélisation : tFileList, tFileInputDelimited, tUnite et tLogRow.

  2. Connectez le composant tFileList au tFileInputDelimited à l'aide d'un lien Iterate et connectez les autres composants à l'aide de liens Row main.

Configurer les composants

  1. Dans l'onglet Basic settings du composant tFileList, sélectionnez le répertoire dans lequel les fichiers à fusionner sont stockés.

    Les fichiers sont très basiques et contiennent une liste de pays et leur score respectif.

  2. Dans la liste Case Sensitive, sélectionnez Yes afin de prendre la casse en compte.

  3. Sélectionnez le composant tFileInputDelimited et affichez son onglet Basic settings.

  4. Pour renseigner le champ File Name/Steam, appuyez sur Ctrl+Espace pour accéder à la liste des variables. Pour traiter tous les fichiers du répertoire défini dans le composant tFileList, sélectionnez tFileList.CURRENT_FILEPATH dans la liste des variables globales.

  5. Cliquez sur le bouton Edit Schema et définissez manuellement le schéma à deux colonnes pour qu'il corresponde au contenu des fichiers d'entrée.

    Pour cet exemple, les deux colonnes sont Country et Points. Elles peuvent toutes les deux prendre une valeur nulle, ainsi cochez les cases de la colonne Nullable. La colonne Country sera de type String, et la colonne Points sera de type Integer.

  6. Cliquez sur OK pour valider les paramètres, puis acceptez la propagation du schéma dans le reste du Job.

  7. Puis sélectionnez le composant tUnite et affichez la vue Component. Notez que le schéma de sortie reflète exactement celui d'entrée et qu'il est en lecture seule.

  8. Dans la vue Component du composant tLogRow, sélectionnez l'option Table (Print values in cells of a table) pour afficher correctement les valeurs de sortie.

Sauvegarder et exécuter le Job

  1. Enregistrez le Job en appuyant sur les touches Ctrl+S.

  2. Appuyez sur la touche F6 ou cliquez sur le bouton Run, dans la vue Run, afin d'exécuter le Job.

    La console affiche les données des différents fichiers, fusionnées dans une seule table.