Scénario 1 : Ecrire des données dans un fichier délimité - 6.3

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario est constitué de trois composants et a pour objectif d'extraire certaines données d'un fichier contenant des informations sur les clients (customers) puis de les écrire dans un fichier délimité en sortie.

Dans l'exemple suivant, vous avez enregistré les informations de connexion et les métadonnées dans le Repository afin de faciliter leur réutilisation. Pour plus d'informations sur comment centraliser les données de connexion et autres métadonnées d'un fichier dans le Repository, consultez le Guide utilisateur du Studio Talend.

Déposer et relier les composants

  1. Dans le Repository, ouvrez le nœud File Delimited de la catégorie Metadata. Cliquez sur la métadonnée customers, et déposez-la dans l'espace de modélisation graphique. Une boîte de dialogue s'ouvre et vous demande quel type de composant vous souhaitez déposer.

  2. Cliquez sur tFileInputDelimited puis sur OK. Un composant tFileInputDelimited contenant le nom de votre schéma d'entrée s'affiche dans l'espace de modélisation graphique.

  3. Déposez un composant tMap et un composant tFileOutputDelimited de la Palette dans l'espace de modélisation graphique.

  4. Reliez les composants à l'aide d'un lien Row > Main.

Configurer les composants

Configurer le composant d'entrée

  1. Double-cliquez sur le composant tFileInputDelimited afin d'afficher sa vue Basic settings. Tous les champs sont renseignés automatiquement car vous avez défini votre fichier d'entrée localement.

  2. Si vous ne définissez pas votre fichier d'entrée localement dans la vue Repository, renseignez les détails manuellement après avoir sélectionné Built-in dans la liste Property Type.

  3. Cliquez sur le bouton [...] près du champ File Name et dans la boîte de dialogue de sélection, parcourez le système de fichiers et sélectionnez le fichier d'entrée, dans cet exemple: customer.csv.

    Avertissement

    Si le chemin d'accès du fichier contient des caractères accentués, vous obtiendrez un message d'erreur lors de l'exécution du Job. Pour plus d'informations concernant la procédure à suivre lorsque les accents ne sont pas supportés, consultez le Guide d'installation et de migration Talend.

  4. Dans les champs Row Separator et Field Separator, saisissez respectivement le séparateur de lignes "\n" et le séparateur de champs ";".

  5. Si besoin, définissez dans les champs correspondants le nombre de lignes utilisées dans l'en-tête (Header) et dans le pied-de-page (Footer), puis définissez le nombre de lignes traitées.

    Dans cet exemple, saisissez 6 pour Header et laissez par défaut les champs Footer et Limit.

  6. Dans le champ Schema, le schéma est défini automatiquement sur Repository et votre schéma est déjà défini puisque vous avez stocké votre fichier d'entrée localement pour cet exemple. Sinon, sélectionnez Built-in et cliquez sur le bouton [...] près de Edit Schema pour ouvrir la boîte de dialogue [Schema], dans laquelle vous pouvez définir le schéma d'entrée. Cliquez ensuite sur OK pour fermer la boîte de dialogue.

Configurer le composant de mapping

  1. Double-cliquez sur le tMap afin d'ouvrir son éditeur.

  2. Dans cet éditeur, cliquez sur le bouton en haut à droite pour ouvrir la boîte de dialogue [Add a new output table].

  3. Saisissez un nom pour la table que vous souhaitez créer, row2 dans cet exemple.

  4. Cliquez sur OK pour valider vos modifications et fermer la boîte de dialogue.

  5. Dans la table de gauche (row1), sélectionnez les trois premières lignes (Id, CustomerName et CustomerAddress) en appuyant sur Ctrl, puis glissez-les dans la table de droite.

  6. Dans le Schema editor en bas de l'éditeur, changez le Type de la ligne RegisterTime, dans la table de droite, et passez-le en chaîne de caractères, String.

  7. Cliquez sur OK pour enregistrer les modifications et fermer l'éditeur.

Configurer le composant de sortie

  1. Dans l'espace de modélisation, double-cliquez sur le composanttFileOutputDelimited pour ouvrir sa vue Component et définir ses propriétés.

  2. Dans le champ Property Type, sélectionnez le mode Built-in et renseignez les champs suivants manuellement.

  3. Cliquez sur le bouton [...] correspondant au champ File Name. Dans la boîte de dialogue, indiquez le répertoire de destination et le nom du fichier dans lequel vous voulez écrire des données, ici customerselection.txt.

  4. Pour les champs Row Separator et Field Separator, saisissez respectivement le séparateur de lignes "\n" et le séparateur de champs ";". Ils sont utilisés dans le fichier de sortie pour délimiter les valeurs et les lignes.

  5. Cochez la case Include Header si vous souhaitez récupérer le libellé des colonnes.

  6. Cliquez sur Edit schema et assurez-vous que le schéma est correctement récupéré du schéma d'entrée. Si nécessaire, cliquez sur Sync Columns pour récupérer le schéma du composant précédent.

Sauvegarder et exécuter le Job

  1. Appuyez sur Ctrl+S pour sauvegarder votre Job.

  2. Appuyez sur F6 ou cliquez sur Run dans l'onglet Run pour exécuter le Job.

    Le fichier créé est délimité par des points-virgules, il ne contient que les colonnes Id, CustomerName et CustomerAddress.

    Les colonnes Id, CustomerName et CustomerAddress sont écrites dans le fichier de sortie défini.