Formats de fichiers supportés par Talend Data Preparation

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.3
2.0
EnrichProdName
Talend Data Fabric
Talend Real-Time Big Data Platform
Talend Big Data Platform
Talend Big Data
Talend MDM Platform
Talend Data Integration
Talend Data Services Platform
Talend Data Management Platform
Talend ESB
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Dans Talend Data Preparation, vous pouvez importer différents types de fichiers pour les utiliser en tant que données source pour vos jeux de données.

Il existe deux principaux types de jeux de données à importer :

  • Jeux de données importés depuis des fichiers locaux
  • Jeux de données créés depuis des Jobs Talend

Depuis des fichiers locaux

Vous pouvez importer les types de fichiers suivants pour les utiliser en tant que jeux de données :

  • .xls ou .xlsx
  • .csv

Pour plus d'informations, consultez Ajout d'un jeu de données depuis un fichier local.

Depuis un Job Talend

En plus des types de fichiers précédents, vous pouvez utiliser des jeux de données créés directement depuis un Job Talend dans le Studio Talend, si vous êtes un utilisateur avec une souscription.

Pour ce faire, utilisez le composant tDatasetOutput en sortie pour votre Job dans le Studio Talend.

Vous pouvez ensuite soit :

Depuis une base de données

Talend Data Preparation peut se connecter à différentes bases de données et les utiliser comme sources afin de créer un nouveau jeu de données. Les données sont toujours stockées dans votre base de données et seul un échantillon est récupéré sur demande.

Pour plus d'informations, consultez Ajout d'un jeu de données depuis une base de données.

Depuis HDFS

Vous pouvez accéder aux données stockées dans un système de fichiers distribué Hadoop (HDFS) et les importer sous forme d'un jeu de données, directement dans l'interface de Talend Data Preparation. Exportez ensuite les données préparées dans le cluster ou exportez-les comme un fichier local.

Pour plus d'informations, consultez Ajout d'un jeu de données depuis HDFS.