Scénario : Créer un graphique en lignes afin de faciliter l'analyse des tendances - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un Job simple qui lit les données d'un fichier CSV et les transforme en graphique en lignes afin de faciliter l'analyse des tendances. Le fichier d'entrée indique combien de temps (en minutes) par semaine une personne regarde différentes chaînes de télévision, sur une période de dix semaines, comme présenté ci-dessous :

Week;TV_A;TV_B;TV_C
1;327;286;244
2;326;285;243
3;325;283;245
4;323;282;246
5;322;285;248
6;321;288;247
7;322;291;245
8;321;292;244
9;320;293;243
10;319;294;242

Le fichier d'entrée ayant une structure différente de celle requise pour l'utilisation d'un tLineChart, un tMap sera utilisé dans ce scénario, afin de mettre en correspondance les données avec un fichier CSV ayant la structure requise, avant d'utiliser le tLineChart pour générer un fichier représentant le graphique en lignes.

Note

Le tMap est généralement utilisé afin d'adapter le schéma d'entrée, conformément à la structure du schéma du composant tLineChart. Pour plus d'informations concernant le composant tMap, consultez le Guide utilisateur du Studio Talend ainsi que le composant tMap.

Déposer et relier les composants

  1. A partir de la Palette, déposez les composants suivants dans l'espace de modélisation graphique : deux composants tFileInputDelimited, un tMap, trois composants tFileOutputDelimited et un tLineChart.

  2. Connectez le premier composant tFileInputDelimited au tMap à l'aide d'une connexion Row > Main.

  3. Reliez le tMap au premier tFileOutputDelimited à l'aide d'une connexion Row > Main et appelez-la TV_A.

  4. Répétez l'étape ci-dessus : connectez le tMap aux deux composants tFileOutputDelimited restants à l'aide d'une connexion Row > Main et appelez-les respectivement TV_B et TV_C.

  5. Connectez le composant tFileInputDelimited au tLineChart à l'aide d'une connexion Row > Main. Cliquez sur Yes pour valider la propagation du schéma à partir du composant cible.

  6. Connectez le premier composant tFileInputDelimited au second tFileInputDelimited à l'aide d'une connexion Trigger > OnSubjobOk.

  7. Connectez le premier tFileDelete au premier composant tFileInputDelimited, et le second tFileInputDelimited au second tFileDelete à l'aide d'une connexion Trigger > OnSubjobOk.

  8. Renommez les composants comme vous le souhaitez afin qu'ils décrivent au mieux leur fonction.

Lire les données source

  1. Double-cliquez sur le premier composant tFileInputDelimited afin d'afficher l'onglet Basic settings.

  2. Renseignez le chemin d'accès au fichier à traiter dans le champ File name en parcourant votre répertoire et en sélectionnant le fichier d'entrée.

  3. Spécifiez dans le champ Header le nombre de lignes d'en-tête, une dans ce scénario. Laissez les autres paramètres tels qu'ils sont.

  4. Cliquez sur Edit schema pour décrire la structure des données du fichier d'entrée. Dans ce scénario, le schéma d'entrée est composé de quatre colonnes : Week, Mins_TVA, Mins_TVB, et Mins_TVC. Une fois le nom des colonnes et les types de données définis, cliquez sur OK pour fermer la boîte de dialogue du schéma.

Adapter les données source au schéma tLineChart

  1. Double-cliquez sur le tMap pour ouvrir l'éditeur Map Editor.

    Le panneau de sortie contient une table d'entrée, ici row1, et le panneau de sortie contient trois tables vides nommées TV_A, TV_B et TV_C.

  2. Utilisez l'éditeur Schema editor pour ajouter trois colonnes à chacune des tables de sortie : series (type String), x (type Integer) et y (type Integer).

  3. Dans le champ Expression de chaque table de sortie, saisissez les noms des series, comme indiqué ci-dessus. Ces noms apparaîtront dans la légende du graphique en lignes.

  4. Déposez la colonne Week de la table d'entrée dans la colonne x de chaque table de sortie.

  5. Déposez la colonne Mins_TVA de la table d'entrée dans la colonne y de la table TV_A.

  6. Déposez la colonne Mins_TVB de la table d'entrée dans la colonne y de la table TV_B.

  7. Déposez la colonne Mins_TVC de la table d'entrée dans la colonne y de la table Mins_TV_C.

  8. Cliquez sur OK pour sauvegarder le mapping, fermer l'éditeur et propager le schéma de sortie au composant de sortie.

Générer le fichier d'entrée temporaire

  1. Double-cliquez sur le premier composant tFileOutputDelimited pour afficher l'onglet Basic settings.

  2. Dans le champ File Name, définissez un fichier CSV dans lequel les flux de données mappés seront envoyés. Dans cet exemple, nommez le fichier de sortie à créer Temp.csv. Ce fichier sera utilisé comme fichier d'entrée pour le composant tLineChart.

  3. Cochez la case Append.

  4. Définissez les paramètres des deux autres composants tFileOutputDelimited exactement de la même manière que dans le premier tFileOutputDelimited.

    Note

    Notez que l'ordre des flux de données sortant du composant tMap n'est pas nécessairement l'ordre dans lequel les données seront écrites dans le composant cible. Pour vous assurer que le fichier est correctement généré, supprimez, s'il existe, le fichier portant le même nom avant d'exécuter le Job. Vérifiez que la case Append est cochée dans tous les composants tFileOutputDelimited afin que tous les flux de données mappés aillent dans le même fichier, sans écraser les données existantes.

Configurer le tLineChart

  1. Double-cliquez sur le second composant tFileInputDelimited afin d'afficher son onglet Basic settings.

  2. Saisissez, dans le champ File name, le chemin d'accès au fichier, ainsi que son nom, le même que celui défini dans chaque composant tFileOutputDelimited. Dans cet exemple, le fichier d'entrée du tLineChart est Temp.csv.

  3. Double-cliquez sur le composant tLineChart pour afficher l'onglet Basic settings.

  4. Cliquez sur Edit schema afin d'ouvrir la boîte de dialogue du schéma.

  5. Le schéma d'entrée et de sortie doivent être synchronisés. Si besoin est, copiez toutes les colonnes du schéma de sortie dans le schéma d'entrée en cliquant sur la double-flèche pointant vers la gauche. Cliquez sur OK pour fermer la boîte de dialogue du schéma.

  6. Dans le champ Generated image path, définissez le chemin d'accès du fichier image à générer.

  7. Dans le champ Chart title, saisissez un titre pour le graphique en lignes. Dans ce scénario, son titre est Average Weekly Viewing (per person).

  8. Saisissez un nom pour les axes (X) et (Y). Dans ce scénario, le nom des axes est respectivement Week et Minutes.

  9. Définissez comme vous le souhaitez la taille de l'image (dans les champs Image width pour la largeur et Image height pour la hauteur), la période dans laquelle est calculée la moyenne mobile (dans le champ Period une fois la case Moving average cochée), les limites inférieures et supérieures (respectivement dans les champs Lower bound et Upper bound), ainsi que la couleur de fond du graphique et du plan (respectivement dans les champs Chart background et Plot background).

    Dans ce scénario, définissez la taille de l'image à 450 by 450, paramétrez le champ Lower bound à 210 et Upper bound à 340, sélectionnez Light_gray dans la liste Chart background et laissez les autres paramètres tels qu'ils sont.

Supprimer le fichier temporaire

  1. Double-cliquez sur le premier composant tFileDelete pour afficher sa vue Basic settings.

  2. Dans le champ File name, renseignez le chemin d'accès du fichier d'entrée et décochez la case Fail on error pour permettre au Job principal d'être exécuté si le fichier à supprimer n'existe pas.

  3. Spécifiez le même chemin d'accès que dans l'autre composant tFileDelete.

Exécuter le Job

  1. Appuyez sur Ctrl+S pour sauvegarder votre Job.

  2. Appuyez sur F6 pour l'exécuter.

Un graphique en lignes est généré selon les critères définis. Il affiche une comparaison du temps de visionnage moyen et des évolutions dans le temps correspondant aux différentes chaînes de télévision.