Regrouper des lignes triées - 7.3

Traitement (Processing) (Intégration)

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)

Ce scénario Java décrit un Job à quatre composants. Il permet de lire un fichier délimité donné ligne par ligne, de trier les données d'entrée en fonction de leur type et de leur ordre, de dénormaliser toutes les lignes d'entrées triées et enfin d'afficher le résultat dans la console de la vue Run.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

  • À partir de la Palette, cliquez-déposez les composants suivants dans l'espace de modélisation graphique : un tFileInputDelimited, un tSortRow, un tDenormalizeSortedRow et un tLogRow.

  • Connectez les quatre composants à l'aide de liens de type Row Main.

  • Dans l'espace de modélisation graphique, sélectionnez le composant tFileInputDelimited.

  • Cliquez sur la vue Component pour définir la configuration de base du tFileInputDelimited.

  • Définissez le champ Property Type en mode Built-In.

  • Renseignez le chemin d'accès au fichier à traiter dans le champ File Name. Dans cet exemple, on utilise le fichier name_list, qui comporte deux colonnes, id et first name.

  • Définissez si nécessaire les séparateurs de lignes et de champs, l'en-tête et le pied-de-page, ainsi que le nombre de lignes traitées.

  • Définissez le champ Schema en mode Built in puis cliquez sur le bouton [...] à côté du champ Edit Schema pour définir les données à passer au composant suivant. Dans cet exemple, le schéma est constitué de deux colonnes, id et name.

  • Dans l'espace de modélisation graphique, sélectionnez le composant tSortRow.

  • Cliquez sur la vue Component pour en définir la configuration de base du tSortRow.

  • Définissez le champ Schema Type en mode Built-In puis cliquez sur Sync columns pour récupérer le schéma à partir du composant tFileInputDelimited.

  • Dans le panneau Criteria, cliquez sur le bouton [+] pour ajouter une ligne puis définissez les paramètres de tri pour la colonne du schéma à traiter. Dans cet exemple, on veut trier la colonne id dans l'ordre croissant.

  • Dans l'espace de modélisation graphique, sélectionnez le composant tDenormalizeSortedRow.

  • Cliquez sur la vue Component pour définir la configuration de base du tDenormalizeSortedRow.

  • Définissez le champ Schema Type en mode Built-In puis cliquez sur Sync columns pour récupérer le schéma à partir du schéma du composant tSortRow.

  • Dans le champ Input rows count, saisissez le nombre de lignes d'entrée à traiter ou cliquez simultanément sur Ctrl+Espace pour accéder à la liste des variables de contexte, puis sélectionnez la variable : tFileInputDelimited_1_NB_LINE

  • Dans le panneau To denormalize, cliquez sur le bouton [+] pour ajouter une ligne puis définissez les paramètres de la colonne à dénormaliser. Dans cet exemple, on veut dénormaliser la colonne name.

  • Dans l'espace de modélisation graphique, sélectionnez le tLogRow puis cliquez sur la vue Component pour en définir la configuration de base. Pour plus d'informations concernant les propriétés du tLogRow, consultez ffg1550477847460.html.

  • Enregistrez votre Job et appuyez sur F6 pour l'exécuter.

Le résultat affiché dans la console montre la façon dont la colonne name a été dénormalisée.