Créer un jeu de données de test - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données

Créer un jeu de données se basant sur un schéma saisi manuellement.

Les jeux de données de test sont utiles pour fournir un jeu de valeurs fixe sans avoir besoin d'un real-life record store, ce qui facilite l'essai du produit.

Procédure

  1. Allez dans Datasets > ADD DATASET.
  2. Dans le panneau Add a new dataset, nommez votre jeu de données de test.
  3. Sélectionnez la connexion de test précédemment créée dans laquelle ajouter vos données.
  4. Sélectionnez le format de vos données :
    • CSV : dans ce cas, le format attendu pour les champs du schéma est le suivant :
      • doit commencer par des caractères [A-Za-z_]
      • ne peut contenir que des caractères [A-Za-z0-9_]
      • ne peut être séparé que par des points-virgules
      Exemple : First_Name;Last_Name;Phone1;Phone2;Address;State;Company
      Remarque : Si vous ne spécifiez pas un format, un format générique sera créé par défaut.
    • JSON : dans ce cas, vous devez respecter un format spécifique pour vos valeurs JSON et faire preuve de cohérence : une séquence d'enregistrements, l'un après l'autre, séparés, ou non, par un saut de ligne. Chaque enregistrement ne doit pas être sur une seule ligne. À la fin, les données dans la zone de texte ne sont pas un document JSON typique avec des crochets.

      Exemple :

        {
          "Id": 3146717,
          "PosTime": 1525097499899,
          "Latitude": 48.8585,
          "Longitude": 2.4921,
          "Operator": "Air France"
        }
        {
          "Id": 3757865,
          "PosTime": 1525097474634,
          "Latitude": 48.5018,
          "Longitude": 2.2246,
          "Operator": "Lufthansa"
        }
    • AVRO : dans ce cas, vous devez également renseigner le schéma de vos enregistrements Avro, qui est un document JSON avec une syntaxe spécifique décrite dans la documentation Avro Apache.
  5. Dans la zone Values, saisissez ou collez vos données.
    La taille de vos données ne peut dépasser 32 kilooctets.
  6. (Facultatif) Cliquez sur VIEW SAMPLE afin de vérifier que vos données sont valides.
  7. Cliquez sur VALIDATE pour sauvegarder votre jeu de données.

Résultats

Vous êtes redirigé·e vers le panneau de vue d'ensemble du jeu de données, dans lequel sont affichées des informations et les métadonnées.

Pour visualiser et comprendre le contenu d'un jeu de données, ouvrez le panneau Sample. Vous pouvez ensuite vérifier que vos données sont valides.