Scénario : Trier des données en ordre ascendant - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un Job à trois composants triant des lignes de données à partir d'une ou plusieurs condition(s) de tri et stockant le résultat dans un fichier local.

Construire le Job

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : tPigSort, tPigLoad, tPigStoreResult.

  2. Connectez le tPigLoad au tPigFilterRow à l'aide d'un lien Row >  Pig Combine.

  3. Connectez le tPigFilterRow au tPigStoreResult à l'aide d'un lien Row > Pig Combine.

Charger les données

  1. Double-cliquez sur le composant tPigLoad pour ouvrir sa vue Basic settings.

  2. Cliquez sur le bouton [...] à côté du champ Edit schema afin d'ajouter des colonnes au schéma du composant tPigLoad.

  3. Cliquez sur le bouton Add afin d'ajouter les colonnes Name, Country et Age et cliquez sur OK pour sauvegarder la configuration.

  4. Sélectionnez Local dans la liste Mode.

  5. Renseignez le champ Input filename avec le chemin d'accès au fichier d'entrée.

    Dans ce scénario, le fichier d'entrée est CustomerList. Il contient les lignes de noms, les noms des pays et les âges des clients.

  6. Sélectionnez PigStorage dans la liste Load function.

  7. Laissez les autres paramètres tels qu'ils sont.

Paramétrer la condition de tri

  1. Double-cliquez sur le tPigSort afin d'ouvrir sa vue Basic settings.

  2. Cliquez sur Sync columns pour récupérer la structure du schéma du composant précédent.

  3. Cliquez sur le bouton Add sous la table Sort key afin d'ajouter une nouvelle clé de tri. Sélectionnez Age dans la liste Column et sélectionnez ASC dans la liste Order.

    Cette clé de tri va trier les données dans la liste CustomerList en ordre ascendant à partir de l'Age.

Sauvegarder les données dans un fichier local

  1. Double-cliquez sur le composant tPigStoreResult afin d'ouvrir sa vue Basic settings.

  2. Cliquez sur Sync columns afin de récupérer la structure du schéma du composant précédent.

  3. Cochez la case Remove result directory if exists.

  4. Renseignez le champ Result file avec le chemin d'accès au fichier de résultat.

    Dans ce scénario, le résultat du filtre est sauvegardé dans le fichier Lucky_Customer.

  5. Sélectionnez PigStorage dans la liste Store function.

  6. Laissez les autres paramètres tels qu'ils sont.

Exécuter le Job

Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Le fichier Lucky_Customer est généré et contient les données en ordre ascendant selon la colonne Age.