Configurer le Job pour agréger des valeurs selon un schéma dynamique - 7.3

Traitement (Processing) (Intégration)

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
Last publication date
2024-03-05

Configurez le Job pour agréger, dans un fichier CSV, des données relatives à l'attribution de tâches, en se basant sur une colonne de schéma dynamique du tAggregateRow.

Cela affiche les données agrégées dans la console, à l'aide d'un tLogRow et écrit le Job dans un fichier CSV de sortie, à l'aide d'un composant tFileOutputDelimited.

Procédure

  1. Double-cliquez sur le composant tFileInputDelimited pour ouvrir sa vue Basic settings.
  2. Dans le champ File name/Stream, spécifiez le chemin d'accès au fichier CSV contenant les données relatives aux attributions des tâches, D:/tasks.csv dans cet exemple.
    task;team;status
    task1;team1;done
    task2;team2;done
    task3;team1;done
    task4;team2;pending
    task5;team1;pending
    task6;team2;pending
  3. Dans le champ Header, saisissez le nombre de lignes à ignorer au début du fichier, 1 dans cet exemple.
    Notez que la fonctionnalité de schéma dynamique est supportée uniquement en mode Built-In et requiert que le fichier d'entrée possède une ligne d'en-tête.
  4. Cliquez sur le bouton à côté du champ Edit schema pour ouvrir la fenêtre du schéma et définissez-le en ajoutant deux colonnes, task de type String et other de type Dynamic. Cela fait, cliquez sur OK afin de sauvegarder les modifications et fermer la fenêtre du schéma.
    Notez que la colonne dynamique doit être définie en dernière position du schéma. Pour plus d'informations concernant le schéma dynamique, consultez le Guide d'utilisation du Studio Talend.
  5. Double-cliquez sur le composant tAggregateRow et, dans sa vue Basic settings, cliquez sur le bouton Sync columns afin de récupérer le schéma du composant précédent.
  6. Ajoutez une ligne à la table Group by en cliquant sur le bouton sous cette table et sélectionnez other dans les champs de colonnes Output column et Input column position afin de grouper les données d'entrée par la colonne dynamique other.
    Notez que l'agrégation de la colonne dynamique peut s'effectuer uniquement pour l'opération de regroupement.
  7. Ajoutez une ligne à la table Operations et définissez l'opération à effectuer. Dans cet exemple, la fonction de l'opération est list. Sélectionnez task dans les champs de colonnes Output column et Input column position afin de lister les entrées dans la colonne task, dans les résultats du regroupement.
  8. Double-cliquez sur le tLogRow pour ouvrir sa vue Basic settings, puis sélectionnez l'option Table (print values in cells of a table) dans la zone Mode pour une meilleure lisibilité des résultats.
  9. Double-cliquez sur le tFileOutputDelimited pour ouvrir sa vue Basic settings et, dans le champ File Name, spécifiez le chemin d'accès au fichier CSV dans lequel écrire les données agrégées, D:/tasks_aggregated.csv, dans cet exemple.
  10. Cochez la case Include Header pour inclure l'en-tête de chaque colonne dans le fichier CSV.