Parser des champs JSON et XML - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
Création et développement > Création de Pipelines
Last publication date
2024-02-27

Un pipeline avec une source, deux processeurs Parser et une destination.

Avant de commencer

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Ici, un jeu de données avec des champs JSON et XML contenant des données concernant les utilisateurs et utilisatrices, y compris leur nom et leur adresse :

    Téléchargez le fichier unparsed-users.csv.

    Importez-le en tant que jeu de données local et configurez le champ Header (En-tête) à 1 pour indiquer que la première ligne du fichier est en un-tête.

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un jeu de données Test.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Parse JSON and XML user fields (Parser des champs utilisateur·trices JSON et XML)
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données source, ici, un mélange de données utilisateurs·rices JSON et XML non parsées saisies manuellement en tant que jeu de données de test.
    Aperçu d'un échantillon de données avec des enregistrements non parsés d'utilisateur·trices.
  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur le bouton + et ajoutez un processeur Parser au pipeline. Le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    parse JSON fields (parser des champs JSON)
  7. Dans la zone Configuration :
    1. Sélectionnez JSON dans la liste Format car vous souhaitez d'abord parser les champs JSON d'entrée.
    2. Sélectionnez .json dans la liste Field to process (Champ à traiter), car vous souhaitez transformer les champs JSON correspondant à l'âge des utilisateur·trices.
    3. Activez Enforce number as double (Implémenter le nombre comme un double) pour vous assurer que les nombres d'entrée, comme l'âge, sont convertis en type de données Double.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de parsing.

    Aperçu du processeur Parser après parsage des enregistrements JSON contenant l'âge des utilisateur·trices.
  8. Cliquez sur le bouton + et ajoutez un processeur Parser au pipeline. Le panneau de configuration s'ouvre.
  9. Donnez un nom significatif au processeur.

    Exemple

    parse XML fields (parser des champs XML)
  10. Dans la zone Configuration :
    1. Sélectionnez XML dans la liste Format car vous souhaitez d'abord parser les champs XML d'entrée.
    2. Sélectionnez .xml dans la liste Field to process (Champ à traiter), car vous souhaitez transformer les champs XML correspondant à l'adresse des utilisateur·trices.
  11. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de parsing.

    Aperçu du processeur Parser après parsage des enregistrements XML contenant l'adresse des utilisateur·trices.
  12. Cliquez sur l'élément ADD DESTINATION et sélectionnez le jeu de données qui contiendra les données de sortie.
    Renommez-le si nécessaire.
  13. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, cliquez sur le bouton Run (Exécuter) pour ouvrir le panneau vous permettant de sélectionner votre profil d'exécution.
  14. Sélectionnez dans la liste votre profil d'exécution (pour plus d'informations, consultez Profils d'exécution), puis cliquez sur Run (Exécuter) pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d'exécution. Les champs JSON et XML d'entrée ont été parsés et transformés en objets JSON et XML.