Scénario : Regrouper des lignes triées - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario Java décrit un Job à quatre composants. Il permet de lire un fichier délimité donné ligne par ligne, de trier les données d'entrées en fonction de leur type et de leur ordre, de dénormaliser toutes les lignes d'entrées triées et enfin d'afficher le résultat dans la console de la vue Run.

  • A partir de la Palette, cliquez-déposez les composants suivants dans l'éditeur graphique : le tFileInputDelimited, le tSortRow, le tDenormalizeSortedRow et le tLogRow.

  • Connectez les quatre composants à l'aide de liens de type Row Main.

  • Dans l'éditeur graphique, sélectionnez le composant tFileInputDelimited.

  • Cliquez sur la vue Component pour définir la configuration de base (Basic settings) du tFileInputDelimited.

  • Définissez le champ Property Type en mode Built-In.

  • Renseignez le chemin d'accès au fichier à traiter dans le champ File Name. Dans cet exemple, on utilise le fichier name_list, qui comporte deux colonnes, id et first name.

  • Définissez si nécessaire les séparateurs de lignes et de champs, l'en-tête et le pied-de-page, ainsi que le nombre de lignes traitées.

  • Définissez le champ Schema en mode Built in puis cliquez sur le bouton [...] à côté du champ Edit Schema pour définir les données à passer au composant suivant. Dans cet exemple, le schéma est constitué de deux colonnes, id et name.

  • Dans l'espace graphique, sélectionnez le composant tSortRow.

  • Cliquez sur la vue Component pour en définir la configuration de base (Basic settings) du tSortRow.

  • Définissez le champ Schema Type en mode Built-In puis cliquez sur Sync columns pour récupérer le schéma à partir du composant tFileInputDelimited.

  • Dans le panneau Criteria, cliquez sur le bouton [+] pour ajouter une ligne puis définissez les paramètres de tri pour la colonne du schéma à traiter. Dans cet exemple, on veut trier la colonne id dans l'ordre croissant.

  • Dans l'espace graphique, sélectionnez le composant tDenormalizeSortedRow.

  • Cliquez sur la vue Component pour définir la configuration de base (Basic settings) du tDenormalizeSortedRow.

  • Définissez le champ Schema en mode Built-In puis cliquez sur Sync columns pour récupérer le schéma à partir du schéma du composant tSortRow.

  • Dans le champ Input rows count, saisissez le nombre de lignes d'entrée à traiter ou cliquez simultanément sur Ctrl+Espace pour accéder à la liste des variables de contexte puis sélectionnez la variable : tFileInputDelimited_1_NB_LINE

  • Dans le panneau To denormalize, cliquez sur le bouton [+] pour ajouter une ligne puis définissez les paramètres de la colonne à dénormaliser. Dans cet exemple, on veut dénormaliser la colonne name.

  • Dans l'éditeur graphique, sélectionnez le composant tLogRow puis cliquez sur la vue Component pour en définir la configuration de base (Basic settings). Pour plus d'informations sur le tLogRow, consultez tLogRow.

  • Enregistrez votre Job puis appuyez sur F6 pour l'exécuter.

Le résultat affiché sur la console montre la façon dont la colonne name a été dénormalisée.