Ajout d'un jeu de données depuis Amazon S3 - 7.3

Guide d'utilisation de Talend Data Preparation

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données
Last publication date
2023-11-29

Talend Data Preparation peut se connecter à différentes sources de données afin de créer de nouveaux jeux de données.

Dans cet exemple, vous allez préparer des données clients stockées dans Amazon S3. Vous allez saisir vos informations de connexion à Amazon S3, directement dans l'interface de Talend Data Preparation et créer un jeu de données à partir de ces données.

Procédure

  1. Dans la vue Datasets (Jeux de données) de la page d'accueil de Talend Data Preparation, cliquez sur la flèche blanche près du bouton Add Dataset (Ajouter un jeu de données).
  2. Sélectionnez Amazon S3.

    Le formulaire Add an Amazon S3 dataset (Ajouter un jeu de données depuis Amazon S3) s'ouvre.

  3. Dans le champ Dataset name (Nom du jeu de données), saisissez le nom à donner à votre jeu de données, Amazon S3 dataset , par exemple.
  4. Cliquez sur Test connection.
    Si la connexion est établie, la seconde partie du formulaire est affichée, dans laquelle vous pouvez sélectionnez l'objet à importer. Si la connexion n'est pas établie, un message d'erreur est affiché, détaillant les raisons de l'échec.
  5. Dans la liste Bucket, sélectionnez l'emplacement de vos données dans Amazon S3.
  6. Dans le champ Path, saisissez le chemin d'accès au jeu de données à importer depuis votre bucket.
  7. Sélectionnez le format, le séparateur d'enregistrements et le séparateur de champs, respectivement dans les champs Record Delimiter et Field Delimiter, ainsi que l'entourage du texte, dans le champ Text Enclosure et le caractère d'échappement, dans le champ Escape Character. Spécifiez également l'encodage de vos données dans le champ Encoding.
  8. Cliquez sur le bouton Add dataset (Ajouter un jeu de données) au bas du formulaire.

Résultats

Une fois l'import terminé, les données extraites d'Amazon S3 s'ouvrent directement dans la grille et vous pouvez commencer à travailler sur votre préparation de la manière habituelle.

Les données sont toujours stockées dans Amazon S3, Talend Data Preparation récupère un échantillon à la demande.

Le jeu de données est ajouté à la liste dans la vue Datasets de la page d'accueil.