Calculer l'occurrence des incidents - Cloud - 8.0

Distribution Amazon EMR

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Création de Jobs > Distributions Hadoop > Amazon EMR
Last publication date
2024-02-21

Procédure

  1. Double-cliquez sur le tAggregateRow pour ouvrir sa vue Component.

    Exemple

  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur du schéma.
  3. Du côté de la sortie, à droite, cliquez deux fois sur le bouton [+] pour ajouter deux lignes et, dans la colonne Column, renommez-les respectivement incident_type et incident_number.

    Exemple

  4. Dans la colonne Type de la ligne incident_number du schéma de sortie, sélectionnez Integer.
  5. Cliquez sur OK pour valider ces modifications et accepter la propagation proposée par la boîte de dialogue qui s'ouvre.
  6. Dans la table Group by, ajoutez une ligne en cliquant sur le bouton [+] et configurez-la comme suit afin de regrouper les données de sortie :
    • Output column : sélectionnez les colonnes du schéma de sortie à utiliser comme conditions pour grouper les données de sortie. Dans cet exemple, il s'agit du incident_type du schéma de sortie.

    • Input column position : sélectionnez les colonnes du schéma d'entrée permettant d'envoyer les données aux colonnes de sortie sélectionnées dans la colonne Output column. Dans cet exemple, il s'agit du incident_type du schéma de sortie.

  7. Dans la table Operations, ajoutez une ligne en cliquant sur le bouton [+] et configurez-la comme suit afin de calculer l'occurrence de chaque type d'incident :
    • Output column : sélectionnez la colonne du schéma de sortie qui contiendra les résultats calculés. Dans ce scénario, il s'agit de incident_number.

    • Function : sélectionnez la fonction à utiliser pour traiter les données entrantes. Dans ce scénario, sélectionnez count. Cette fonction calcule la fréquence de chaque incident.

    • Input column position : sélectionnez la colonne du schéma d'entrée afin de fournir les données à traiter. Dans ce scénario, il s'agit de incident_type.