Agréger les informations extraites - 7.3

Code Java personnalisé pour Storm

Version
7.3
Language
Français
Product
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Custom Code (Intégration) > Composant Custom Code Java pour Storm
Gouvernance de données > Systèmes tiers > Composants Custom Code (Intégration) > Composant Custom Code Java pour Storm
Qualité et préparation de données > Systèmes tiers > Composants Custom Code (Intégration) > Composant Custom Code Java pour Storm
Last publication date
2024-02-22

Procédure

  1. Double-cliquez sur le tAggregateRow pour ouvrir sa vue Component. Ce composant vous permet de voir quelle est l'activité la plus populaire dans les messages reçus.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma.
  3. Du côté de la sortie, à droite, cliquez trois fois sur le bouton [+] pour ajouter trois lignes. Dans la colonne Column, renommez-les respectivement activity, gender et popularity.
  4. Dans la colonne Type de la ligne popularity du schéma de sortie, sélectionnez Double.
  5. Cliquez sur OK pour valider ces modifications et acceptez la propagation proposée par la boîte de dialogue qui s'ouvre.
  6. Dans la table Group by, ajoutez deux lignes en cliquant deux fois sur le bouton [+] et en configurant ces lignes comme suit afin de regrouper les données de sortie :

    Colonne

    Description

    Output column

    Sélectionnez les colonnes du schéma de sortie à utiliser comme conditions pour grouper les données de sortie. Dans cet exemple, les colonnes à utiliser sont activity et gender.

    Input column position

    Sélectionnez les colonnes du schéma d'entrée permettant d'envoyer les données aux colonnes de sortie sélectionnées dans la colonne Output column. Dans ce scénario, ces colonnes sont activity et gender.

  7. Dans la table Operations, ajoutez une ligne en cliquant sur le bouton [+] et configurez-la comme suit afin de calculer la popularité de chaque activité :

    Colonne

    Description

    Output column

    Sélectionnez la colonne du schéma de sortie qui contiendra les résultats calculés. Dans ce scénario, la colonne est popularity.

    Function

    Sélectionnez la fonction à utiliser pour traiter les données entrantes. Dans ce scénario, sélectionnez count. La fonction compte la fréquence de chaque activité dans les messages reçus.

    Input column position

    Sélectionnez la colonne du schéma d'entrée afin de fournir les données à traiter. Dans ce scénario, la colonne est activity.