Trier des données basées sur un schéma dynamique - 6.4

Processing (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
EnrichPlatform
Studio Talend

Ce scénario s'applique uniquement aux produits Talend nécessitant souscription.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Dans ce scénario, des données sont triées dans un fichier d'entrée basé sur un schéma dynamique, le résultat de l'opération de tri est affiché dans la console Run, puis sauvegardé dans un fichier de sortie. Pour plus d'informations concernant la fonction de schéma dynamique, consultez le Guide utilisateur du Studio Talend .

  • A partir de la Palette, cliquez déposez dans l'éditeur graphique les composants requis pour ce scénario : tFileInputDelimited, tSortRow, tLogRow et tFileOutputDelimited.

  • Connectez-les à l'aide de liens de type Row > Main.

  • Double-cliquez sur le composant tFileInputDelimited pour afficher l'onglet Basic settings de sa vue Component.

  • Sélectionnez Built-In dans la liste déroulante Property Type.

  • Cliquez sur le bouton [...] à droite du champ File Name afin de parcourir votre répertoire et de sélectionner votre fichier d'entrée. Dans ce scénario, le fichier d'entrée cars.csv contient cinq colonnes : ID_Owner, Registration, Make, Color, et ID_Reseller.

  • Spécifiez dans le champ Header quelle est la ligne d'en-tête. Dans ce scénario, il s'agit de la première ligne.

  • Sélectionnez Built-In dans la liste déroulante Schema, puis cliquez sur Edit schema pour paramétrer le schéma d'entrée.

Avertissement :

La colonne dynamique doit être définie sur la dernière ligne du schéma.

  • Dans l'éditeur de schéma, ajoutez deux colonnes à l'aide du bouton [+] et nommez les respectivement ID_Owner et Other. Paramétrez le type de données de la colonne Other en Dynamic afin de récupérer toutes les colonnes non définies dans le schéma.

  • Cliquez sur OK pour propager le schéma et fermer l'éditeur de schéma.

  • Double-cliquez sur le composant tSortRow pour afficher l'onglet Basic settings de sa vue Component.

  • Ajoutez une ligne dans le tableau Criteria à l'aide du bouton [+], sélectionnez Other dans Schema column, alpha dans le type de tri, puis sélectionnez l'ordre asc (ascendant) ou desc (descendant) des données de sortie.

Avertissement :

Le tri des colonnes dynamiques ne fonctionne que lorsque le type de tri est configuré en alpha.

  • Pour visionner les données de sortie sous forme de tableau dans la console Run, double-cliquez sur le composant tLogRow et sélectionnez l'option Table dans l'onglet Basic settings.

  • Double-cliquez sur le composant tFileOutputDelimited pour afficher l'onglet Basic settings de sa vue Component.

  • Cliquez sur le bouton [...] à droite du champ File name afin de parcourir et sélectionner le répertoire dans lequel vous souhaitez enregistrer le fichier de sortie, puis donnez-lui un nom..

  • Cochez la case Include Header pour récupérer les noms des colonnes ainsi que les données triées.

  • Enregistrez votre Job puis appuyez sur F6 pour l'exécuter.

    Le résultat de l'opération de tri s'affiche dans la console Run et est écrit dans le fichier de sortie.