Agréger le prix moyen des achats clients - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Pipeline Designer
task
Création et développement > Création de Pipelines

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Ici, une liste hiérarchique de données clients, contenant l'ID, les informations produits comme le titre et le prix du livre, que vous pouvez trouver jointes à ce document (téléchargez le fichier aggregate-customers.json depuis l'onglet Téléchargements à gauche de la page).

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un fichier stocké dans HDFS.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Aggregate Average Purchase Price
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données source, ici une liste de données clients hiérarchiques concernant des achats de livres.

    Exemple

  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur et ajoutez un processeur Aggregate au pipeline. Le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    calculate average price
  7. Dans la zone GROUP BY, cliquez sur l'icône représentant une Corbeille près du champ vide afin de le supprimer, puisque vous souhaitez agréger le jeu de données complet dans un seul enregistrement.
  8. Dans la zone OPERATIONS :
    1. Sélectionnez .product.price dans la liste Field path et Average dans la liste Operation puisque vous souhaitez grouper le prix moyen de tous les livres achetés par les clients.
    2. Nommez le champ généré (Output field name), avgPrice par exemple.
  9. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Vous pouvez prévisualiser les données calculées après l'opération d'agrégation : le prix moyen des livres est de 13,96 dollars.

  10. Cliquez sur l'élément ADD DESTINATION dans le pipeline pour ouvrir le panneau vous permettant de sélectionner le jeu de données qui contiendra vos données de sortie (HDFS).
    Renommez-le si nécessaire.
  11. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, sélectionnez votre profil d'exécution dans la liste (pour plus d'informations, consultez Run profiles).
  12. Cliquez sur l'icône d'exécution pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d'exécution, le prix moyen des livres est agrégé en un seul enregistrement et le flux de sortie est envoyé vers les systèmes cible définis.