Ouverture d'un jeu de données depuis un fichier local - Cloud

Guide de prise en main de Talend Cloud Data Preparation

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données

Vous allez maintenant importer le fichier qui contient les données clients et créer votre première préparation.

Après la connexion à Talend Cloud Data Preparation, vous êtes dirigé(e) vers la vue Preparations (Préparations).

Cette vue montre la liste de toutes vos préparations, en d'autres termes les jeux de données sur lesquels vous avez commencé à travailler. Elle est vide pour le moment, mais c'est ici que sera sauvegardé votre travail sur les données clients à nettoyer. Depuis cette vue, vous pouvez également créer de nouvelles préparations et les organiser dans des dossiers.

Pour importer le fichier contenant les données brutes, procédez comme suit :

Avant de commencer

Récupérez le fichier customers.xlsx depuis l'onglet Téléchargements du menu situé dans le panneau de gauche de la page.

Procédure

  1. Dans le menu du panneau de gauche, sélectionnez Datasets pour ouvrir la liste des jeux de données, vide pour le moment.
  2. Pour importer le fichier customers.xlsx précédemment téléchargé, vous pouvez :
    • cliquer sur le bouton Drop a file or browse (Glisser un fichier ou parcourir) afin de parcourir vos fichiers et sélectionner le jeu de données ;
    • glisser-déposer directement le jeu de données dans l'écran de Talend Cloud Data Preparation.
    Le panneau Add a new dataset (Ajouter un jeu de données) s'ouvre, dans lequel vous pouvez définir le nom et le format du jeu de données avant de l'importer.
  3. Dans le champ Dataset name, saisissez Customers.
  4. Le champ Connection est déjà renseigné.
    Comme ceci est votre premier import de jeu de données local, une connexion de type local, Local connection, est créée au cours du processus. Cette connexion sous-jacente sera utilisée pour charger tous vos jeux de données locaux.
  5. Vous pouvez saisir, de manière facultative, une description pour votre jeu de données dans le champ correspondant.
  6. Dans la section Format config du formulaire, cliquez sur le bouton Auto detect afin de renseigner automatiquement les informations de Format.
  7. Cliquez sur le bouton View sample pour prévisualiser les 50 premières lignes de votre jeu de données.
  8. Cliquez sur Validate afin de finaliser la création du jeu de données.
  9. Dans le panneau de gauche, sélectionnez Preparations et cliquez sur le bouton Add preparation.
  10. Dans le panneau Add a preparation qui s'ouvre, nommez votre préparation, customers_preparation dans cet exemple et, dans la liste Dataset, sélectionnez le jeu de données Customers précédemment créé.
  11. Cliquez sur Submit.

Résultats

Votre jeu de données s'ouvre sous la forme d'une préparation avec une recette vide. Les données n'ont pas encore été modifiées, mais ont été sauvegardées en tant que préparation, sur laquelle vous pouvez commencer à travailler.

Puisque vous avez importé le jeu de données customers.xlsx et créé la préparation correspondante en utilisant le bouton Add preparation (Ajouter une préparation), tous les changements effectués sur customers_preparation seront automatiquement sauvegardés. En ce qui concerne le jeu de données brutes que vous avez importé, il peut être consulté dans la vue Datasets (Jeux de données) et les données restent intactes.