Parser des champs JSON et XML

Un pipeline avec une source, deux processeurs Parser et une destination.

Avant de commencer

Vous avez précédemment ajouté le jeu de données contenant vos données source.

Ici, un jeu de données avec des champs JSON et XML contenant des données concernant les utilisateurs et utilisatrices, y compris leur nom et leur adresse :

Téléchargez le fichier unparsed-users.csv.

Importez-le en tant que jeu de données local et configurez le champ Header (En-tête) à 1 pour indiquer que la première ligne du fichier est en un-tête.
Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

Ici, un jeu de données Test.

Procédure

Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
Donnez-lui un nom significatif.
Exemple
Parse JSON and XML user fields (Parser des champs utilisateur·trices JSON et XML)
Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données source, ici, un mélange de données utilisateur·trices JSON et XML non parsées saisies manuellement en tant que jeu de données de test.
Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
Renommez-le si nécessaire.
Cliquez sur le bouton et ajoutez un processeur Parser au pipeline. Le panneau de configuration s'ouvre.
Donnez un nom significatif au processeur.
Exemple
parse JSON fields (parser des champs JSON)
Dans la zone Configuration :
1. Sélectionnez JSON dans la liste Format car vous souhaitez d'abord parser les champs JSON d'entrée.
2. Sélectionnez .json dans la liste Field to process (Champ à traiter), car vous souhaitez transformer les champs JSON correspondant à l'âge des utilisateur·trices.
3. Activez Enforce number as double (Implémenter le nombre comme un double) pour vous assurer que les nombres d'entrée, comme l'âge, sont convertis en type de données Double.
Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de parsing.
Cliquez sur le bouton et ajoutez un processeur Parser au pipeline. Le panneau de configuration s'ouvre.
Donnez un nom significatif au processeur.
Exemple
parse XML fields (parser des champs XML)
Dans la zone Configuration :
1. Sélectionnez XML dans la liste Format car vous souhaitez d'abord parser les champs XML d'entrée.
2. Sélectionnez .xml dans la liste Field to process (Champ à traiter), car vous souhaitez transformer les champs XML correspondant à l'adresse des utilisateur·trices.
Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de parsing.
Cliquez sur l'élément ADD DESTINATION et sélectionnez le jeu de données qui contiendra les données de sortie.
Renommez-le si nécessaire.
Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, cliquez sur le bouton Run (Exécuter) pour ouvrir le panneau vous permettant de sélectionner votre profil d'exécution.
Sélectionnez dans la liste votre profil d'exécution (pour plus d'informations, consultez Profils d'exécution), puis cliquez sur Run (Exécuter) pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d'exécution. Les champs JSON et XML d'entrée ont été parsés et transformés en objets JSON et XML.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !

Laissez vos commentaires ici