Configurer le Job - Cloud - 8.0

Excel

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants Excel
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants Excel
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants Excel

Procédure

  1. Double-cliquez sur le tFixedFlowInput_1 pour ouvrir sa vue Basic settings.
    1. Ouvrez l'éditeur du schéma en cliquant sur le bouton […] près de Edit schema et ajoutez les trois colonnes suivantes dans l'éditeur du schéma : name de type String, city de type String et quantity de type Integer.
    2. Sélectionnez Use Inline Content (delimited file) et saisissez ce qui suit dans le champ Content.
      Jack;Bei Jing;18
      Mary;Shang Hai;20
      Tom;Shen Zhen;25
    3. Laissez les valeurs par défaut des autres options.

    Ce composant configure les données à écrire dans le fichier Excel 2007.

  2. Double-cliquez sur le tFileOutputExcel_1 pour ouvrir sa vue Basic settings.
    1. Sélectionnez Write excel2007 file format (xlsx) et saisissez le chemin d'accès au fichier cible ("D:/temp/customers.xlsx" dans cet exemple) dans le champ File Name.
      Remarque :
      • Vous pouvez également saisir manuellement le chemin d'accès au fichier en cliquant sur le bouton [...] près du champ File Name et en navigant vers le fichier cible ou vers le dossier cible.
      • Le fichier cible sera écrasé s'il existe déjà. Sinon, il sera créé.
    2. Cochez la case Include Header.
    3. Cliquez sur le bouton [...] près du champ Edit schema et vérifiez que le composant a bien le même schéma que le tFixedFlowInput_1.

      Vous pouvez synchroniser le schéma et celui du tFixedFlowInput_1 en cliquant sur le bouton Sync columns.

    4. Laissez les valeurs par défaut des autres options.

    Ce composant écrit les données reçues dans le fichier cible.

  3. Double-cliquez sur le tFileInputExcel_1 pour ouvrir sa vue Basic settings.
    1. Sélectionnez Read excel2007 file format (xlsx) et saisissez le chemin d'accès au fichier Excel ("D:/temp/customers.xlsx") duquel lire les données dans le champ File name/Stream.
      Remarque : Vous pouvez également renseigner le chemin d'accès au fichier en cliquant sur le bouton [...] près du champ File name/Stream et en navigant vers le fichier cible.
    2. Ajoutez une ligne à la table Sheet list en cliquant sur le bouton [+] sous la table et saisissez le nom de la feuille ("Sheet1" dans cet exemple) dans la colonne Sheet.
      Remarque : Le nom de la feuille doit être le nom de la feuille de votre choix dans le fichier Excel spécifié.
    3. Saisissez 1 dans le champ First column et 4 dans le champ Last column.
      Remarque : Le nombre dans le champ Last column doit être supérieur à celui du nombre de colonnes utilisées dans le fichier Excel.
    4. Vous pouvez ouvrir l'éditeur du schéma en cliquant sur le bouton [...] à côté du champ Edit schema.
    5. Ajoutez une ligne dans l'éditeur du schéma en cliquant sur le bouton [+], saisissez doc dans le champ Column, sélectionnez Dynamic dans la liste déroulante Type et cliquez sur OK pour fermer l'éditeur du schéma.
      Remarque : Cette configuration permet de donner au schéma le type dynamique. Un schéma est dynamique lorsqu'il contient une colonne dont le Type est Dynamic et que cette colonne est la seule ou la dernière du schéma.
    6. Laissez les valeurs par défaut des autres options.

    Ce composant extrait des données depuis le fichier Excel à l'aide d'un schéma dynamique.

  4. Double-cliquez sur le tLogRow_1 pour ouvrir sa vue Basic settings.
    1. Cliquez sur le bouton [...] près du champ Edit schema et vérifiez que le composant a bien le même schéma que le tFileInputExcel_1.

      Vous pouvez synchroniser le schéma et celui du tFileInputExcel_1 en cliquant sur le bouton Sync columns.

    2. Sélectionnez l'option Table (print values in cells of a table).
    3. Laissez les valeurs par défaut des autres options.
    Ce composant affiche les données extraites à l'aide d'un schéma dynamique.
  5. Double-cliquez sur le tFileOutputDelimited_1 pour ouvrir sa vue Basic settings.
    1. Saisissez le chemin d'accès au fichier dans lequel écrire les données ("D:/temp/customers.csv" dans cet exemple), dans le champ File Name.
      Remarque :
      • Vous pouvez également renseigner le chemin d'accès au fichier en cliquant sur le bouton [...] près du champ File Name et en navigant vers le fichier cible.
      • Le fichier cible sera écrasé s'il existe déjà. Sinon, il sera créé.
    2. Cliquez sur le bouton [...] près du champ Edit schema et vérifiez que le composant a bien le même schéma que le tLogRow_1.

      Vous pouvez synchroniser le schéma et celui du tLogRow_1 en cliquant sur le bouton Sync columns.

    3. Laissez les valeurs par défaut des autres options.
    Ce composant écrit les données reçues dans un fichier CSV à l'aide du schéma dynamique.
  6. Double-cliquez sur le tFileInputExcel_2 pour ouvrir sa vue Basic settings.
    1. Sélectionnez Read excel2007 file format (xlsx) et saisissez le chemin d'accès au fichier Excel ("D:/temp/customers.xlsx") duquel lire les données dans le champ File name/Stream.
      Remarque : Vous pouvez également renseigner le chemin d'accès au fichier en cliquant sur le bouton [...] près du champ File name/Stream et en navigant vers le fichier cible.
    2. Ajoutez une ligne à la table Sheet list en cliquant sur le bouton [+] sous la table et saisissez le nom de la feuille ("Sheet1" dans cet exemple) dans la colonne Sheet.
      Remarque : Le nom de la feuille doit être le nom de la feuille de votre choix dans le fichier Excel spécifié.
    3. Saisissez 1 dans le champ Header.
    4. Saisissez 1 dans le champ First column et 4 dans le champ Last column.
      Remarque : Le nombre dans le champ Last column doit être supérieur à celui du nombre de colonnes utilisées dans le fichier Excel.
    5. Vous pouvez ouvrir l'éditeur du schéma en cliquant sur le bouton [...] à côté du champ Edit schema.
    6. Dans l'éditeur de schéma, ajoutez les mêmes colonnes que dans le schéma du tFixedFlowInput_1 et cliquez sur OK pour fermer l'éditeur du schéma.
    7. Laissez les valeurs par défaut des autres options.

    Ce composant extrait des données du fichier Excel de la manière normale.

  7. Double-cliquez sur le tLogRow_2 pour ouvrir sa vue Basic settings.
    1. Cliquez sur le bouton [...] près du champ Edit schema et vérifiez que le composant a bien le même schéma que le tFileInputExcel_2.

      Vous pouvez synchroniser le schéma et celui du tFileInputExcel_2 en cliquant sur le bouton Sync columns.

    2. Sélectionnez l'option Table (print values in cells of a table).
    3. Laissez les valeurs par défaut des autres options.
    Ce composant affiche les données extraites de la manière normale.