Lire un fichier dans le Studio Talend - 8.0

Version
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Création de Jobs

Lire un fichier dans le Studio Talend

Le Studio Talend vous permet d'accéder facilement à vos données grâce à une grande variété de composants. Dans ce tutoriel, découvrez comment accéder aux données stockées dans un fichier CSV standard.

Créer un projet dans le Studio Talend

Créer un projet est la première étape d'utilisation du Studio Talend. Les projets vous permettent d'organiser votre travail.

Procédure

  1. Sélectionnez Create a new project.
  2. Saisissez un nom pour votre projet.

    Exemple

    TalendDemo
  3. Cliquez sur Create.
  4. Cliquez sur Finish.

Résultats

Votre projet s'ouvre. Vous êtes prêt·e à travailler dans le Studio Talend.

Créer un Job pour lire un fichier délimité

Les projets du Studio Talend contiennent des Jobs. Dans les Jobs, vous pouvez construire des workflows via les composants, ce qui vous permet d'effectuer des actions spécifiques.

Avant de commencer

Sélectionnez la perspective Integration (Window > Perspective > Integration).

Procédure

  1. Dans le Repository, cliquez-droit sur Job Designs.
    1. Sélectionnez Create Standard Job.
  2. Dans le champ Name, saisissez un nom.

    Exemple

    readCSV
  3. Facultatif : Dans le champ Purpose, saisissez un objectif.

    Exemple

    Read a .csv file
  4. Facultatif : Dans le champ Description, saisissez une description.

    Exemple

    This tutorial uses a component to read a .csv file
    Conseil : Saisir un objectif dans le champ Purpose et une Description permet une meilleure organisation.
  5. Cliquez sur Finish.

Résultats

L'espace de modélisation graphique (Designer) ouvre un Job vide.

Configurer un composant pour lire un fichier délimité

Les composants du Studio Talend vous permettent d'effectuer des actions spécifiques. Vous pouvez les ajouter dans des Jobs. Vous pouvez utiliser le composant tFileInputDelimited pour lire un fichier délimité, par exemple.

Avant de commencer

Ce tutoriel utilise un fichier .csv. Si vous n'avez pas de fichier .csv, cliquez sur l'onglet Téléchargements et enregistrez le fichier customers_unordered.csv sur votre machine.

Procédure

  1. Cliquez dans l'espace de modélisation graphique (Designer).
  2. Saisissez tFileInputDelimited et sélectionnez le composant du même nom.
  3. Dans l'espace de modélisation graphique (Designer), double-cliquez sur le composant tFileInputDelimited.
    1. Cliquez sur le bouton [...] à côté du champ File Name/Stream.
    2. Sélectionnez le fichier de votre choix dans l'explorateur de fichiers.
    3. Facultatif : Si le séparateur de champs de votre fichier est différent de celui spécifié dans le champ Field Separator, modifiez-le.
      Remarque : Le séparateur de champs (Field Separator) le plus utilisé est ;.

Résultats

Vous avez ajouté un composant tFileInputDelimited et sélectionné un fichier à lire.

Définir le schéma d'un composant pour lire un fichier délimité

Définir le schéma du composant gérant le fichier délimité vous permet de configurer les données sur lesquelles vous allez travailler.

Avant de commencer

Vous avez ajouté et configuré un composant tFileInputDelimited (consultez Configurer un composant pour lire un fichier délimité).

Procédure

  1. Dans l'espace de modélisation graphique (Designer), double-cliquez sur le composant tFileInputDelimited.
  2. Cliquez sur le bouton [...] correspondant au champ Edit schema.
    L'assistant Schema s'ouvre.
  3. Cliquez sur le bouton [+] pour ajouter une colonne (Column).
    1. Ajoutez autant de colonnes qu'il y a d'en-têtes dans votre fichier .csv.
      Remarque : Les en-têtes sont les premières valeurs d'un fichier .csv.
    2. Saisissez le nom de chaque colonne (Column).
      Les noms des colonnes (Column) doivent être identiques aux noms des en-têtes.

      Exemple

      • First
      • Last
      • Number
      • Street
      • City (ville)
      • État
    3. Sélectionnez le Type de chaque colonne (Column).
      Conseil : Sélectionnez le Type String pour un code postal. Les codes postaux ne sont pas utilisés pour effectuer des opérations arithmétiques.
  4. Cliquez sur OK.

Résultats

Vous avez défini le schéma de votre fichier.

Lire un fichier délimité et afficher son contenu dans la console

Vous pouvez afficher le résultat d'un processus en utilisant un lien vers un composant tLogRow. Le composant tLogRow affiche les données dans la console de la vue Run.

Avant de commencer

Procédure

  1. Dans l'espace de modélisation graphique (Designer), ajoutez un composant tLogRow.
  2. Cliquez-droit sur le composant tFileInputDelimited.
    1. Sélectionnez Row > Main.
    2. Cliquez sur le tLogRow pour relier les deux composants.
  3. Dans la vue Run, cliquez sur le bouton Run pour exécuter votre Job.

Résultats

Le tFileInputDelimited lit votre fichier délimité et le tLogRow affiche son contenu dans la console.