Agréger des valeurs et trier des données - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Cet exemple vous montre comment utiliser des composants Talend pour agréger les résultats totaux d'étudiants et trier les résultats agrégés selon le nom des étudiants.

Créer un Job pour agréger et trier les données

Créez un Job pour agréger les résultats totaux des étudiants à l'aide du composant tAggregateRow, trier les données agrégées à l'aide du tSortRow, puis pour afficher les données agrégées et triées dans la console.

  1. Créez un nouveau Job et ajoutez un composant tFixedFlowInput, un tAggregateRow, un tSortRow et un tLogRow en saisissant leur nom dans l'espace de modélisation graphique ou en les déposant depuis la Palette.

  2. Reliez le composant tFixedFlowInput au tAggregateRow à l'aide d'un lien Row > Main.

  3. Répétez l'opération pour relier le tAggregateRow au tSortRow et le tSortRow au tLogRow.

Configurer le Job pour agréger et trier les données

Configurez le Job pour agréger les résultats totaux des étudiants à l'aide du tAggregateRow et trier les données agrégées à l'aide du composant tSortRow.

  1. Double-cliquez sur le composant tFixedFlowInput pour ouvrir sa vue Basic settings.

  2. Cliquez sur le bouton à côté du champ Edit schema pour ouvrir la fenêtre de schéma et le définir, en ajoutant deux colonnes, name, de type String et score, de type Double. Cela fait, cliquez sur OK pour sauvegarder les modifications et fermer la fenêtre du schéma.

  3. Dans la zone Mode, sélectionnez Use Inline Content (delimited file) et, dans le champ Content qui s'affiche, saisissez les données d'entrée suivantes :

    Peter;92
    James;93
    Thomas;91
    Peter;94
    James;96
    Thomas;95
    Peter;96
    James;92
    Thomas;98
    Peter;95
    James;96
    Thomas;93
    Peter;98
    James;97
    Thomas;95
  4. Double-cliquez sur le composant tAggregateRow pour ouvrir sa vue Basic settings.

  5. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la fenêtre du schéma et définissez le schéma en ajoutant cinq colonnes, name, de type String et sum, average, max et min, de type Double.

    Cela fait, cliquez sur OK pour sauvegarder les modifications et fermer la fenêtre du schéma.

  6. Ajoutez une ligne à la table Group by en cliquant sur le bouton [+] sous la table et sélectionnez name dans les colonnes Output column et Input column position, afin de grouper les données d'entrée selon la colonne name.

  7. Ajoutez quatre lignes à la table Operations et définissez les opérations à effectuer. Dans cet exemple, les opérations sont sum, average, max et min. Sélectionnez score dans les quatre lignes de la colonne Input column position afin d'agréger les données d'entrée selon les résultats.

  8. Double-cliquez sur le tSortRow pour ouvrir sa vue Basic settings.

  9. Ajoutez une ligne à la table Criteria et spécifiez la colonnes sur laquelle baser l'opération de tri. Dans cet exemple, la colonne name. Sélectionnez alpha dans la colonne sort num or alpha?, puis asc dans la colonne Order asc or desc?, afin de trier les données agrégées par ordre alphabétique ascendant.

  10. Double-cliquez sur le composant tLogRow pour ouvrir sa vue Basic settings et sélectionnez Table (print values in cells of a table) dans la zone Mode, pour une lisibilité optimale des résultats.

Exécuter le Job pour agréger et trier les données

Après avoir configuré le Job et ses composants pour agréger et trier les données, vous pouvez exécuter le Job et vérifier ses résultats d'exécution.

  1. Appuyez sur les touches Ctrl + S afin de sauvegarder le Job.

  2. Appuyez sur F6 pour l'exécuter.

    Comme affiché ci-dessus, les résultats totaux des étudiants sont agrégés et triés par ordre alphabétique ascendant selon le nom des étudiants.