Scénario : Lire des données d'un fichier positionnel

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Data Quality
Talend Open Studio for Big Data
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Open Studio for Data Integration
task
Gouvernance de données
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Le scénario suivant permet de lire des données d'un fichier positionnel contenant deux schémas. Le fichier positionnel se présente comme suit :

schema_1 (car_owner):schema_id;car_make;owner;age
schema_2 (car-insurance):schema_id;car_owner;age;car_insurance
1bmw     John      45
1bench   Mike      30
2John      45 yes 
2Mike      50 No      

Déposer les composants

  1. Déposez un tFileInputMSPositional et deux composants tLogRow de la Palette dans l'espace de modélisation graphique.

  2. Renommez les deux composants tLogRow, respectivement car_owner et car_insurance.

Configurer les composants

  1. Double-cliquez sur le tFileInputMSPositional pour afficher sa vue Basic settings et paramétrer ses propriétés.

  2. Dans le champ File name/Stream, saisissez le chemin d'accès à votre fichier d'entrée. Vous pouvez également cliquer sur le bouton [...] pour parcourir votre système et sélectionner votre fichier.

  3. Dans le champ Header Field Position, saisissez la position de début et de fin de l'en-tête pour l'identifiant du schéma dans le fichier d'entrée, 0-1, dans ce cas, puisque le premier caractère de chaque ligne est l'identifiant du schéma.

  4. Cliquez deux fois sur le bouton [+] pour ajouter deux lignes à la table Records.

  5. Cliquez sur la cellule dans la colonne Schema pour afficher le bouton [...].

    Cliquez sur le bouton [...] pour ouvrir la boîte de dialogue de nommage du schéma.

  6. Saisissez le nom du schéma et cliquez sur OK.

    Le nom du schéma apparaît dans la cellule et l'éditeur du schéma s'ouvre.

  7. Définissez le schéma car_owner, contenant quatre colonnes : schema_id, car_make, owner et age.

  8. Répétez ces étapes pour définir le schéma car_insurance, contenant quatre colonnes : schema_id, car_owner, age et car_insurance.

  9. Connectez le composant tFileInputMSPositional au car_owner à l'aide d'un lien Row > car_owner et au composant car_insurance à l'aide d'un lien Row > car_insurance.

  10. Dans la colonne Header value, saisissez l'identifiant du schéma, 1 pour le schéma car_owner et 2 pour le schéma car_insurance.

  11. Dans la colonne Pattern, saisissez la longueur de chaque champ du schéma, c'est-à-dire le nombre de caractères, 1,8,10,3 pour le schéma car_owner et 1,10,3,3 pour le schéma car_insurance dans ce scénario.

  12. Dans le champ skip from header, saisissez le nombre de lignes d'en-tête à ignorer, 2 dans cet exemple, car les deux premières lignes décrivent les deux schémas et ne fournissent aucune valeur.

  13. Sélectionnez Table (print values in cells of a table) dans la zone Mode des composants car_owner et car_insurance.

Enregistrer et exécuter le Job

  1. Appuyez sur les touches Ctrl+S afin de sauvegarder votre Job.

  2. Appuyez sur F6 ou cliquez sur le bouton Run de la vue Run pour exécuter le Job.

    Le fichier est lu ligne par ligne selon les valeurs de longueur définies dans le champ Pattern et écrit en sortie dans deux tables ayant deux schémas différents.