Trier un fichier dans le Studio Talend - 7.3

Version
7.3
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Création de Jobs

Trier un fichier dans le Studio Talend

Dans ce tutoriel, apprenez à utiliser un composant tSortRow pour trier les données d'un fichier dans le Studio Talend.

Ce tutoriel utilise un fichier .csv. Si vous n'avez pas de fichier .csv, cliquez sur l'onglet Téléchargements et enregistrez le fichier customers_unordered.csv sur votre machine.

Créer un projet dans le Studio Talend

Créer un projet est la première étape d'utilisation du Studio Talend. Les projets vous permettent d'organiser votre travail.

Procédure

  1. Sélectionnez Create a new project.
  2. Saisissez un nom pour votre projet.

    Exemple

    TalendDemo
  3. Cliquez sur Create.
  4. Cliquez sur Finish.

Résultats

Votre projet s'ouvre. Vous êtes prêt·e à travailler dans le Studio Talend.

Créer un Job pour trier un fichier délimité

Les projets du Studio Talend contiennent des Jobs. Dans les Jobs, vous pouvez construire des workflows via les composants, ce qui vous permet d'effectuer des actions spécifiques.

Avant de commencer

Sélectionnez la perspective Integration (Window > Perspective > Integration).

Procédure

  1. Dans le Repository, cliquez-droit sur Job Designs.
    1. Sélectionnez Create Standard Job.
  2. Dans le champ Name, saisissez un nom.

    Exemple

    SortCSVfile
  3. Facultatif : Dans le champ Purpose, saisissez un objectif.

    Exemple

    Sort a .csv file
  4. Facultatif : Dans le champ Description, saisissez une description.

    Exemple

    Sort a .csv file according to a defined column
    Conseil : Saisir un objectif dans le champ Purpose et une Description permet une meilleure organisation.
  5. Cliquez sur Finish.

Résultats

L'espace de modélisation graphique (Designer) ouvre un Job vide.

Configurer un composant pour lire un fichier délimité

Les composants du Studio Talend vous permettent d'effectuer des actions spécifiques. Vous pouvez les ajouter dans des Jobs. Vous pouvez utiliser le composant tFileInputDelimited pour lire un fichier délimité, par exemple.

Avant de commencer

Ce tutoriel utilise un fichier .csv. Si vous n'avez pas de fichier .csv, cliquez sur l'onglet Téléchargements et enregistrez le fichier customers_unordered.csv sur votre machine.

Procédure

  1. Cliquez dans l'espace de modélisation graphique (Designer).
  2. Saisissez tFileInputDelimited et sélectionnez le composant du même nom.
  3. Dans l'espace de modélisation graphique (Designer), double-cliquez sur le composant tFileInputDelimited.
    1. Cliquez sur le bouton [...] à côté du champ File Name/Stream.
    2. Sélectionnez le fichier de votre choix dans l'explorateur de fichiers.
    3. Facultatif : Si le séparateur de champs de votre fichier est différent de celui spécifié dans le champ Field Separator, modifiez-le.
      Remarque : Le séparateur de champs (Field Separator) le plus utilisé est ;.

Résultats

Vous avez ajouté un composant tFileInputDelimited et sélectionné un fichier à lire.

Définir le schéma d'un composant pour lire un fichier délimité

Définir le schéma du composant gérant le fichier délimité vous permet de configurer les données sur lesquelles vous allez travailler.

Avant de commencer

Vous avez ajouté et configuré un composant tFileInputDelimited (consultez Configurer un composant pour lire un fichier délimité).

Procédure

  1. Dans l'espace de modélisation graphique (Designer), double-cliquez sur le composant tFileInputDelimited.
  2. Cliquez sur le bouton [...] correspondant au champ Edit schema.
    L'assistant Schema s'ouvre.
  3. Cliquez sur le bouton [+] pour ajouter une colonne (Column).
    1. Ajoutez autant de colonnes qu'il y a d'en-têtes dans votre fichier .csv.
      Remarque : Les en-têtes sont les premières valeurs d'un fichier .csv.
    2. Saisissez le nom de chaque colonne (Column).
      Les noms des colonnes (Column) doivent être identiques aux noms des en-têtes.

      Exemple

      • First
      • Last
      • Number
      • Street
      • City (ville)
      • État
    3. Sélectionnez le Type de chaque colonne (Column).
      Conseil : Sélectionnez le Type String pour un code postal. Les codes postaux ne sont pas utilisés pour effectuer des opérations arithmétiques.
  4. Cliquez sur OK.

Résultats

Vous avez défini le schéma de votre fichier.

Trier vos données

Grâce au composant tSortRow, vous pouvez trier vos données dans le Studio Talend.

Trier un fichier délimité

Vous pouvez trier un fichier délimité via un lien vers un composant tSortRow. Le composant tSortRow trie les données d'entrée en se basant sur une ou plusieurs colonnes de données et trie par exemple par type ou par ordre.

Avant de commencer

Procédure

  1. Dans l'espace de modélisation graphique (Designer), ajoutez un composant tSortRow.
  2. Cliquez-droit sur le composant tFileInputDelimited.
    1. Sélectionnez Row > Main.
    2. Cliquez sur le tSortRow pour relier les deux composants.
  3. Double-cliquez sur le tSortRow.
  4. Cliquez sur le bouton [...] correspondant au champ Edit schema.
    Comme ils sont liés, le composant tSortRow hérite du schéma du composant tFileInputDelimited.
  5. Cliquez sur le bouton [+] pour ajouter une règle de tri.

    Exemple

    1. Dans Schema column, sélectionnez City.
    2. Dans sort num or alpha?, sélectionnez alpha.
  6. Facultatif : Cliquez sur le bouton [+] pour ajouter une autre règle.

    Exemple

    1. Dans Schema column, sélectionnez Street.
    2. Dans sort num or alpha?, sélectionnez alpha.

Résultats

Vous avez configuré les données du fichier délimité pour les trier.

Afficher les résultats du tri d'un fichier délimité

Vous pouvez afficher le résultat d'un processus en utilisant un lien vers un composant tLogRow. Le composant tLogRow affiche les données dans la console de la vue Run.

Avant de commencer

Procédure

  1. Dans l'espace de modélisation graphique (Designer), ajoutez un composant tLogRow.
  2. Cliquez-droit sur le tSortRow.
    1. Sélectionnez Row > Main.
    2. Cliquez sur le tLogRow pour relier les deux composants.