tFileInputProperties - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tFileInputProperties

Famille de composant

File/Input

 

Fonction

Le composant tFileInputProperties lit un fichier texte ligne par ligne et extrait les champs.

Objectif

Il ouvre un fichier texte qu'il lit ligne par ligne, sépare les champs sur le modèle clé=valeur.

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma peut être Built-in ou distant dans le Repository.

Le schéma de ce composant est en lecture seule. Il se compose de deux colonnes, Key et Value, correspondant respectivement au nom du paramètre et à la valeur du paramètre à copier.

 

File format

Sélectionnez le format de votre fichier .properties ou .ini.

 

 

.properties : fichier de configuration dont les données sont disposées sur deux lignes et structurées de la manière suivante clé=valeur.

 

 

.ini : fichier de configuration dont les données sont disposées sur deux lignes, structurées de la manière suivante clé=valeur et regroupées en sections.

Retrieve Mode :

- Retrieve All pour récupérer l'intégralité du fichier,

- Retrieve Sections pour récupérer les sections du fichier,

-Retrieve by section pour récupérer les données contenues dans la section spécifiée dans le champ Section Name.

Section Name : saisissez le nom de la section sur laquelle effectuer l'opération d'itération.

 

File

Chemin d'accès et nom du fichier, et/ou variable à traiter.

Pour plus d'informations concernant l'utilisation et la définition de variables, consultez le Guide utilisateur du Studio Talend.

 

Calculate MD5 Hash

Cochez cette case pour que l'algorithme vérifie que le fichier est bien téléchargé.

Advanced settings

Encoding

Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données des bases de données.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job, ainsi qu'au niveau de chaque composant.

Global Variables

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Utilisez ce composant pour lire un fichier et séparer les données en fonction de la structure clé=valeur du fichier.

Scénario : Lire et mapper la clé et les valeurs de fichiers properties et alimenter un glossaire

Le scénario suivant est un Job de quatre composants lisant deux fichiers propriétés en anglais et en français. Ces données sont ensuite mises en correspondance afin de constituer un glossaire.

Les fichiers de propriétés utilisés pour ce scénario sont des fichiers contenant les chaînes de caractères utilisés pour la localisation du composant tMysqlInput dans votre Studio Talend.

Déposer et relier les composants

  1. Cliquez-glissez deux composants tFileInputProperties de la famille File > Input dans le Job designer, un composant tMap de la famille Processing et un composant tLogRow de la famille Log & Errors.

  2. Reliez les composants entre eux via des connexions Row > Main Le second fichier, FR, est utilisé comme flux de référence.

Configurer les composants

  1. Double-cliquez sur le premier composant tFileInputProperties pour paramétrer ses propriétés dans l'onglet Basic settings de la vue Component.

  2. Dans le champ File Format, sélectionnez le format de votre fichier.

  3. Dans le champ File Name, cliquez sur le bouton [...] et sélectionnez le fichier .properties anglais que vous souhaitez utiliser.

  4. Répétez cette procédure avec le deuxième composant et le fichier français :

  5. Double-cliquez sur le composant tMap pour ouvrir son éditeur :

  6. Sélectionnez toutes les colonnes de la table English_terms et glissez-les vers la table de sortie.

    Sélectionnez la colonne key de la table English_terms et glissez-la dans la colonne key de la table French_terms.

  7. Dans le tableau glossary de la zone Schema editor en bas du tMap, renommez le champ value en EN puisqu'il contiendra les valeurs du fichier anglais.

  8. Cliquez sur le bouton [+] pour ajouter une ligne au tableau glossary et renommez-la FR.

  9. Dans le champ Length, configurez la taille maximum du champ à 255.

  10. Dans le coin supérieur gauche de l'éditeur du tMap, sélectionnez la colonne value de la table English_terms et glissez-la dans la colonne FR de la table French_terms. Cliquez sur OK pour valider vos modifications et fermer l'éditeur de mapping, puis propagez les modifications au composant suivant.

Sauvegarder et exécuter le Job

  1. Appuyez sur les touches Ctrl+S pour enregistrer votre Job.

  2. Appuyez sur F6 pour l'exécuter ou cliquez sur le bouton Run de la vue Run.

Le glossaire apparaît dans la console de la vue Run avec dans la première colonne le nom de la clé, dans la deuxième le terme du fichier anglais et dans le troisième colonne le terme correspondant du fichier français.