Formats de fichiers supportés par Talend Cloud Data Preparation - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Dans Talend Cloud Data Preparation, différents formats de fichiers sont supportés pour servir de source à vos jeux de données, ainsi que de formats de sortie au moment de l'export de vos préparations.

Depuis un fichier local

Vous pouvez importer les types de fichiers suivants pour les utiliser en tant que jeux de données :

  • .xls ou .xlsx
  • Fichier avec séparateur
Remarque : Les fichiers positionnels ne sont pas supportés.

Les préparations basées sur des fichiers locaux peuvent être exportées aux formats suivants :

  • Fichier local avec séparateur
  • .xlsx local
  • Tableau local
  • Amazon S3

Pour plus d'informations, consultez Ajout d'un jeu de données depuis un fichier local.

Depuis un Job Talend

En plus des types de fichiers précédents, vous pouvez utiliser des jeux de données créés directement depuis un Job Talend dans le Studio Talend.

Pour ce faire, utilisez le composant tDatasetOutput en sortie pour votre Job dans le Studio Talend.

Vous pouvez ensuite soit :

  • exécuter le Job directement dans le Studio Talend. Pour plus d'informations, consultez la documentation de Composants Data Preparation.
  • utiliser la fonctionnalité "Live dataset" (jeu de données en temps réel) pour l'exécuter via Talend Cloud Management Console et accéder aux données directement dans Talend Data Preparation. Pour plus d'informations, consultez Jeux de données en temps réel.

Les préparations basées sur des Jobs Talend peuvent être exportées aux formats suivants :

  • Fichier local avec séparateur
  • .xlsx local
  • Tableau local
  • Amazon S3

Depuis une base de données

Talend Cloud Data Preparation peut se connecter à différentes bases de données et les utiliser comme sources afin de créer un nouveau jeu de données. Les données sont toujours stockées dans votre base de données et seul un échantillon est récupéré sur demande.

Les préparations basées sur des jeux de données issus de bases de données peuvent être exportées aux formats suivants :

  • Fichier local avec séparateur
  • .xlsx local
  • Tableau local
  • Amazon S3
  • HDFS en tant que fichier avec séparateur, Avro ou Parquet

Pour plus d'informations, consultez Ajout d'un jeu de données depuis une base de données.

Depuis Salesforce

Vous pouvez accéder à des données stockées dans Salesforce, et les importer sous forme d'un jeu de données, directement dans l'interface de Talend Cloud Data Preparation.

Les préparations basées sur des jeux de données issus de Salesforce peuvent être exportées aux formats suivants :

  • Fichier local avec séparateur
  • .xlsx local
  • Tableau local

Pour plus d'informations, consultez Ajout d'un jeu de données depuis Salesforce.

Depuis Amazon S3

Vous pouvez accéder à des données stockées dans Amazon S3, et les importer sous forme d'un jeu de données, directement dans l'interface de Talend Cloud Data Preparation.

Vous pouvez importer les types de fichiers suivant stockés sur Amazon S3 :

  • Fichier avec séparateur
  • .xlsx
  • Avro
  • Parquet

Les préparations basées sur des fichiers HDFS peuvent être exportées aux formats suivants :

  • Fichier local avec séparateur
  • .xlsx local
  • Tableau local
  • Amazon S3
  • HDFS en tant que fichier avec séparateur, Avro ou Parquet

Pour plus d'informations, consultez Ajout d'un jeu de données depuis Amazon S3.