Combiner des codes pays utilisateurs et des noms de pays - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Pipeline Designer
task
Création et développement > Création de Pipelines

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

    Ici, une connexion de test.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Ici, le jeu de données de gauche contient les données utilisateur·rice avec les codes pays et les index et le jeu de données de droite contient les données à combiner aux données source : noms de pays et index (téléchargez les fichiers join-countries.json et join-users.json depuis l'onglet Téléchargements à gauche de la page).

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, une connexion de test.

Procédure

  1. Cliquez sur ADD PIPELINE dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Join Country Data
  3. Cliquez sur Create Source pour ouvrir le panneau vous permettant de sélectionner vos données source, ici une liste de clients, avec des codes pays stockés dans HDFS.

    Exemple

  4. Sélectionnez votre jeu de données et cliquez sur SELECT pour l’ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur et ajoutez un processeur Join au pipeline. Le panneau de Configuration s’affiche.
  6. Donnez un nom significatif au processeur.

    Exemple

    combine country data
  7. Dans la zone CONFIGURATION :
    1. Sélectionnez le jeu de données à combiner au jeu de données source (ici un jeu de données nommé Countries) dans la liste Join dataset.
    2. Sélectionnez Left outer join dans la liste Join type, puisque vous souhaitez que les enregistrements rapprochés et les enregistrements supplémentaires du jeu de données de gauche soient listés dans l'ensemble de résultats.
  8. Dans la zone CONDITIONS :
    1. Sélectionnez ou saisissez le chemin d'accès à l'enregistrement existant à comparer dans le jeu de données de gauche (ici, .countryCode) dans la liste Left key.
    2. Sélectionnez ou saisissez le chemin d'accès à l'enregistrement existant à comparer dans le jeu de données de droite (ici, .index) dans la liste Right key.

      Vous pouvez utiliser la syntaxe avpath dans cette zone.

  9. Cliquez sur SAVE pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de jointure.

    Remarque : Après avoir sauvegardé la configuration du processeur Join, l'onglet JOIN DATASET s'affiche dans la zone Data preview afin de vous laisser prévisualiser le résultat de l'opération de jointure.
  10. Cliquez sur l'élément ADD DESTINATION à côté du processeur Join et sélectionnez le jeu de données qui contiendra les données jointes.
    Renommez-le si nécessaire.
  11. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, sélectionnez votre profil d'exécution dans la liste (pour plus d'informations, consultez Run profiles).
  12. Cliquez sur l'icône d'exécution pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d'exécution, les données des pays des utilisateurs et des utilisatrices sont jointes et les codes pays, ainsi que les noms complets des pays, sont combinés dans la sortie générée envoyée dans le système cible défini.