Configurer le Job - 6.4

Processing (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
EnrichPlatform
Studio Talend

Configurez le Job pour agréger, dans un fichier CSV, des données relatives à l'affectation de tâches, en se basant sur une colonne de schéma dynamique.

Pour cela, utilisez un composant tAggregateRow, puis affichez les données agrégées dans la console, à l'aide d'un tLogRow et écrivez ces données dans un fichier CSV de sortie, à l'aide d'un composant tFileOutputDelimited

Procédure

  1. Double-cliquez sur le tFileInputDelimited pour ouvrir sa vue Basic settings.
  2. Dans le champ File name/Stream, spécifiez le chemin d'accès au fichier CSV contenant les données relatives aux affectations des tâches, D:/tasks.csv dans cet exemple.
    task;team;status
    task1;team1;done
    task2;team2;done
    task3;team1;done
    task4;team2;pending
    task5;team1;pending
    task6;team2;pending
  3. Dans le champ Header, saisissez le nombre de lignes à ignorer au début du fichier, 1 dans cet exemple.
    Notez que la fonctionnalité de schéma dynamique est supportée uniquement en mode Built-In et requiert que le fichier d'entrée possède une ligne d'en-tête.
  4. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la fenêtre du schéma et définissez-le en ajoutant deux colonnes, task de type String et other de type Dynamic. Cela fait, cliquez sur OK afin de sauvegarder les modifications et fermer la fenêtre du schéma.
    Notez que la colonne dynamique doit être définie en dernière position du schéma. Pour plus d'informations concernant le schéma dynamique, consultez le Guide utilisateur du Studio Talend .
  5. Double-cliquez sur le composant tAggregateRow et, dans sa vue Basic settings, cliquez sur le bouton Sync columns afin de récupérer le schéma du composant précédent.
  6. Ajoutez une ligne à la table Group by en cliquant sur le bouton [+] sous cette table et sélectionnez other dans les colonnes Output column et Input column position afin de grouper les données d'entrée par la colonne dynamique other.
    Notez que l'agrégation de la colonne dynamique peut s'effectuer uniquement pour l'opération de regroupement.
  7. Ajoutez une ligne à la table Operations et définissez l'opération à effectuer. Dans cet exemple, la fonction de l'opération est list. Sélectionnez task dans les colonnes Output column et Input column position afin de lister les entrées dans la colonne task, dans les résultats du regroupement.
  8. Double-cliquez sur le tLogRow pour ouvrir sa vue Basic settings et sélectionnez Table (print values in cells of a table), dans la zone Mode, pour une lisibilité optimale des résultats.
  9. Double-cliquez sur le tFileOutputDelimited pour ouvrir sa vue Basic settings et, dans le champ File Name, spécifiez le chemin d'accès au fichier CSV dans lequel écrire les données agrégées, D:/tasks_aggregated.csv, dans cet exemple.
  10. Cochez la case Include Header pour inclure l'en-tête de chaque colonne dans le fichier CSV.