Accéder au contenu principal Passer au contenu complémentaire

Agréger les informations extraites

Procédure

  1. Double-cliquez sur le tAggregateRow pour ouvrir sa vue Component. Ce composant vous permet de voir quelle est l'activité la plus populaire dans les messages reçus.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma.
  3. Du côté de la sortie, à droite, cliquez trois fois sur le bouton [+] pour ajouter trois lignes. Dans la colonne Column, renommez-les respectivement activity, gender et popularity.
  4. Dans la colonne Type de la ligne popularity du schéma de sortie, sélectionnez Double.
  5. Cliquez sur OK pour valider ces modifications et acceptez la propagation proposée par la boîte de dialogue qui s'ouvre.
  6. Dans la table Group by, ajoutez deux lignes en cliquant deux fois sur le bouton [+] et en configurant ces lignes comme suit afin de regrouper les données de sortie :

    Colonne

    Description

    Output column

    Sélectionnez les colonnes du schéma de sortie à utiliser comme conditions pour grouper les données de sortie. Dans cet exemple, les colonnes à utiliser sont activity et gender.

    Input column position

    Sélectionnez les colonnes du schéma d'entrée permettant d'envoyer les données aux colonnes de sortie sélectionnées dans la colonne Output column. Dans ce scénario, ces colonnes sont activity et gender.

  7. Dans la table Operations, ajoutez une ligne en cliquant sur le bouton [+] et configurez-la comme suit afin de calculer la popularité de chaque activité :

    Colonne

    Description

    Output column

    Sélectionnez la colonne du schéma de sortie qui contiendra les résultats calculés. Dans ce scénario, la colonne est popularity.

    Function

    Sélectionnez la fonction à utiliser pour traiter les données entrantes. Dans ce scénario, sélectionnez count. La fonction compte la fréquence de chaque activité dans les messages reçus.

    Input column position

    Sélectionnez la colonne du schéma d'entrée afin de fournir les données à traiter. Dans ce scénario, la colonne est activity.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !