Scénario : Afficher le contenu d'un fichier ARFF - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le scénario suivant décrit un Job formé de deux composants ayant pour objectif de lire ligne à ligne un fichier ARFF, de sélectionner des données délimitées et d'afficher la sortie dans la console de la vue Run.

Un fichier ARFF se présente comme suit :

Un fichier ARFF est généralement composé de deux parties : la description de la structure des données, correspondant aux lignes qui débutent par @attribute, et les données brutes, qui suivent l'expression @data.

Déposer et relier les composants

  1. Glissez et déposez le composant tFileInputARFF de la Palette dans l'espace de modélisation graphique.

  2. Glissez et déposez de la même manière le composant tLogRow

  3. Cliquez-droit sur le composant tFileInputARFF et sélectionnez Row > Main dans le menu contextuel. Glissez ce lien vers le tLogRow et relâchez lorsque le symbole de prise de courant apparaît. La transmission du flux de donnée entre les deux composants est ainsi établie.

Configurer les composants

  1. Double-cliquez sur le tFileInputARFF pour paramétrer ce composant.

  2. Dans la vue Component, renseignez le champ File Name. Parcourez votre répertoire de fichiers, afin de sélectionner le fichier .arff.

  3. Dans le champ Schema, sélectionnez Built-In.

  4. Cliquez sur le bouton [...] du champ Edit schema, pour effectuer manuellement la description des colonnes du fichier lu.

  5. Cliquez autant de fois sur le bouton  que nécessaire pour décrire chacune des colonnes du fichier lu. Dans cet exemple, 17 colonnes sont ajoutées, nommez-les comme suit :

  6. Pour chacune des colonnes sélectionnez le Type : chaîne de caractères (String).

  7. Cliquez sur OK.

  8. Dans l'espace de modélisation, double-cliquez sur le composant tLogRow pour afficher sa vue Component.

  9. Cliquez sur le bouton [...] du champ Edit schema pour vérifier que le schéma a bien été propagé. Si ce n'est pas le cas, cliquez sur le bouton Sync columns.

Sauvegarder et exécuter le Job

  1. Appuyez sur les touches Ctrl+S pour sauvegarder votre Job.

  2. Appuyez sur F6 pour l'exécuter.

La console affiche les données contenues dans le fichier ARFF délimitées par une barre verticale (séparateur par défaut).