Lecture des jeux de données depuis votre dossier local - 6.5

Data Preparation

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Preparation
Gouvernance de données > Systèmes tiers > Composants Data Preparation
Qualité et préparation de données > Systèmes tiers > Composants Data Preparation
EnrichPlatform
Studio Talend
Talend Data Preparation

Procédure

  1. Dans l'espace de modélisation graphique, sélectionnez tFileList_1 et cliquez sur son onglet Component pour configurer ses paramètres simples.

    Ce premier tFileList va lire le dossier customers_files et récupérer les chemins des deux sous-dossiers pour qu'ils puissent être réutilisés plus tard.

  2. Dans le champ Directory, saisissez le chemin vers le dossier customers_files, qui contient les jeux de données, dans leurs sous-dossiers respectifs.
  3. Cliquez sur le bouton + sous le tableau Filemask pour y ajouter une nouvelle ligne que vous renommerez *, entre guillemets doubles.
  4. Dans l'espace de modélisation graphique, sélectionnez tFileList_2 et cliquez sur son onglet Component pour définir ses paramètres simples.

    Ce second tFileList va lire les quatre jeux de données .csv contenus dans les deux sous-dossiers et récupérer leurs chemins.

  5. Pour renseigner le champ Directory avec une expression qui va récupérer de manière dynamique les noms des jeux de données, faites-la glisser depuis la liste des expressions du tFileList_1, dans le panneau Outline.
  6. Cochez la case Includes subdirectories.
  7. Cliquez sur le bouton + sous le tableau Filemask pour y ajouter une ligne que vous renommerez *.csv, entre guillemets doubles.
  8. Dans l'espace de modélisation graphique, sélectionnez tFileInputDelimited et cliquez sur son onglet Component pour définir ses paramètres simples.
  9. Pour renseigner le champ File name/Stream avec une expression qui va récupérer de manière dynamique les chemins des jeux de données, faites-la glisser depuis la liste des expressions du tFileList_2, dans le panneau Outline.
  10. Dans les champs Row Separator et Field Separator, saisissez les séparateurs de champs et de lignes qui correspondent à vos jeux de données, entre guillemets doubles.
  11. Cliquez sur le bouton Edit schema pour définir les colonnes qui constituent vos jeux de données, ainsi que leur type.

    Le schéma est le même pour tous les jeux de données du dossier customers_files. Vérifiez que ce schéma correspond au schéma attendu par le composant tDataprepRun. En d'autres termes, le schéma d'entrée doit être le même que celui du jeu de données sur lequel la préparation a d'abord été créée.