Créer un jeu de données de test - Cloud

Guide d'utilisation de Talend Cloud Pipeline Designer

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
Administration et monitoring > Monitoring de logs
Administration et monitoring > Monitoring des exécutions
Création et développement > Création de Pipelines
Déploiement > Déploiement > Exécution de Pipelines
Gouvernance de données > Filtrage de données
Qualité et préparation de données > Filtrage de données
Qualité et préparation de données > Gestion des jeux de données
Last publication date
2024-02-12

Créer un jeu de données se basant sur un schéma saisi manuellement.

Les jeux de données de test sont utiles pour fournir un jeu de valeurs fixe sans avoir besoin d'un real-life record store, ce qui facilite l'essai du produit.

Procédure

  1. Allez dans Datasets (Jeux de données) > Add dataset (Ajouter un jeu de données).
  2. Dans le panneau Add a new dataset, nommez votre jeu de données de test.
  3. Sélectionnez la connexion de test précédemment créée dans laquelle ajouter vos données.
  4. Sélectionnez le format de vos données :
    • CSV : dans ce cas, le format attendu pour les champs du schéma est le suivant :
      • doit commencer par des caractères [A-Za-z_]
      • ne peut contenir que des caractères [A-Za-z0-9_]
      • ne peut être séparé que par des points-virgules
      Exemple : First_Name;Last_Name;Phone1;Phone2;Address;State;Company
      Remarque : Si vous ne spécifiez pas un format, un format générique sera créé par défaut.
    • JSON : dans ce cas, vous devez respecter un format spécifique pour vos valeurs JSON et faire preuve de cohérence : une séquence d'enregistrements, l'un après l'autre, séparés, ou non, par un saut de ligne. Chaque enregistrement ne doit pas être sur une seule ligne. À la fin, les données dans la zone de texte ne sont pas un document JSON typique avec des crochets.

      Exemple :

        {
          "Id": 3146717,
          "PosTime": 1525097499899,
          "Latitude": 48.8585,
          "Longitude": 2.4921,
          "Operator": "Air France"
        }
        {
          "Id": 3757865,
          "PosTime": 1525097474634,
          "Latitude": 48.5018,
          "Longitude": 2.2246,
          "Operator": "Lufthansa"
        }
    • AVRO : dans ce cas, vous devez également renseigner le schéma de vos enregistrements Avro, qui est un document JSON avec une syntaxe spécifique décrite dans la documentation Avro Apache.
  5. Dans la zone Values, saisissez ou collez vos données.
    La taille de vos données ne peut dépasser 32 kilooctets.
    Nouvelle page de configuration des jeux de données avec des valeurs JSON saisies manuellement.
  6. (Facultatif) Cliquez sur View sample (Voir l'échantillon) afin de vérifier que vos données sont valides.
  7. Cliquez sur Validate (Valider) pour sauvegarder votre jeu de données.

Résultats

Vous êtes redirigé·e vers le panneau de vue d'ensemble du jeu de données, dans lequel sont affichées des informations et les métadonnées.

Pour visualiser et comprendre le contenu d'un jeu de données, ouvrez le panneau Sample. Vous pouvez ensuite vérifier que vos données sont valides.

Panneau d'échantillon du jeu de données
Panneau d'échantillon affichant une vue tabulaire des valeurs JSON du jeu de données.