Configurer le Job pour agréger et trier les données - 6.4

Processing (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
EnrichPlatform
Studio Talend
Configurez le Job pour agréger les résultats totaux des étudiants à l'aide du tAggregateRow et trier les données agrégées à l'aide du composant tSortRow.

Procédure

  1. Double-cliquez sur le composant tFixedFlowInput pour ouvrir sa vue Basic settings.
  2. Cliquez sur le bouton à côté du champ Edit schema pour ouvrir la fenêtre de schéma et le définir, en ajoutant deux colonnes, name, de type String et score, de type Double. Cela fait, cliquez sur OK pour sauvegarder les modifications et fermer la fenêtre du schéma.
  3. Dans la zone Mode, sélectionnez Use Inline Content (delimited file) et, dans le champ Content qui s'affiche, saisissez les données d'entrée suivantes :
    Peter;92
    James;93
    Thomas;91
    Peter;94
    James;96
    Thomas;95
    Peter;96
    James;92
    Thomas;98
    Peter;95
    James;96
    Thomas;93
    Peter;98
    James;97
    Thomas;95
  4. Double-cliquez sur le composant tAggregateRow pour ouvrir sa vue Basic settings.
  5. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la fenêtre du schéma et définissez le schéma en ajoutant cinq colonnes, name, de type String et sum, average, max et min, de type Double.
    Cela fait, cliquez sur OK pour sauvegarder les modifications et fermer la fenêtre du schéma.
  6. Ajoutez une ligne à la table Group by en cliquant sur le bouton [+] sous la table et sélectionnez name dans les colonnes Output column et Input column position, afin de grouper les données d'entrée selon la colonne name.
  7. Ajoutez quatre lignes à la table Operations et définissez les opérations à effectuer. Dans cet exemple, les opérations sont sum, average, max et min. Sélectionnez score dans les quatre lignes de la colonne Input column position afin d'agréger les données d'entrée selon les résultats.
  8. Double-cliquez sur le tSortRow pour ouvrir sa vue Basic settings.
  9. Ajoutez une ligne à la table Criteria et spécifiez la colonnes sur laquelle baser l'opération de tri. Dans cet exemple, la colonne name. Sélectionnez alpha dans la colonne sort num or alpha?, puis asc dans la colonne Order asc or desc?, afin de trier les données agrégées par ordre alphabétique ascendant.
  10. Double-cliquez sur le composant tLogRow pour ouvrir sa vue Basic settings et sélectionnez Table (print values in cells of a table) dans la zone Mode, pour une lisibilité optimale des résultats.