Formats de fichiers supportés par Talend Data Preparation

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend Data Services Platform
Talend Big Data Platform
Talend ESB
Talend Data Management Platform
Talend Data Integration
Talend Data Fabric
Talend Big Data
Talend Real-Time Big Data Platform
Talend MDM Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Dans Talend Data Preparation, vous pouvez importer différents types de fichiers pour les utiliser en tant que données source pour vos jeux de données.

Depuis des fichiers locaux

Vous pouvez importer les types de fichiers suivants pour les utiliser en tant que jeux de données :

  • .xls ou .xlsx
  • .csv

Pour plus d'informations, consultez Ajout d'un jeu de données depuis un fichier local.

Depuis un Job Talend

En plus des types de fichiers précédents, vous pouvez utiliser des jeux de données créés directement depuis un Job Talend dans le Studio Talend, si vous êtes un utilisateur avec une souscription.

Pour ce faire, utilisez le composant tDatasetOutput en sortie pour votre Job dans le Studio Talend.

Vous pouvez ensuite soit :

Depuis une base de données

Talend Data Preparation peut se connecter à différentes bases de données et les utiliser comme sources afin de créer un nouveau jeu de données. Les données sont toujours stockées dans votre base de données et seul un échantillon est récupéré sur demande.

Pour plus d'informations, consultez Ajout d'un jeu de données depuis une base de données.

Depuis HDFS

Vous pouvez accéder aux données stockées dans un système de fichiers distribué Hadoop (HDFS) et les importer sous forme d'un jeu de données, directement dans l'interface de Talend Data Preparation. Exportez ensuite les données préparées dans le cluster ou exportez-les comme un fichier local.

Pour plus d'informations, consultez Ajout d'un jeu de données depuis HDFS.

Depuis Salesforce

Vous pouvez accéder à des données stockées dans Salesforce, et les importer sous forme d'un jeu de donnéesand import it in the form of a dataset, directement dans l'interface de Talend Data Preparation. Exportez ensuite les données préparées comme un fichier local.

Pour plus d'informations, consultez Ajout d'un jeu de données depuis Salesforce.

Depuis Amazon S3

Vous pouvez accéder à des données stockées dans Amazon S3, et les importer sous forme d'un jeu de donnéesand import it in the form of a dataset, directement dans l'interface de Talend Data Preparation. Exportez ensuite les données préparées vers un fichier local, vers un cluster Hadoop, ou encore directement vers Amazon S3.

Pour plus d'informations, consultez Ajout d'un jeu de données depuis Amazon S3.