Scénario : Utiliser une colonne pivot pour agréger des données - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le scénario suivant décrit un Job qui agrège des données d'un fichier d'entrée délimité à l'aide d'une colonne pivot.

Déposer et relier les composants

  1. Cliquez sur les composants suivant et déposez-les dans l'espace de modélisation : tFileInputDelimited, tPivotToColumnsDelimited.

  2. Reliez les composants à l'aide d'un lien Row > Main.

Configurer les composants

Paramétrer le composant d'entrée

  1. Double-cliquez sur le tFileInputDelimited pour afficher sa vue Basic settings.

  2. Parcourez votre système jusqu'au fichier d'entrée dans le champ File Name.

    Le fichier à utiliser se compose de trois colonnes, ID, Question et Answer.

  3. Définissez les séparateurs de lignes (Row) et de champs (Field), respectivement : retour chariot et point virgule, dans cet exemple.

  4. Le fichier contient un en-tête, ainsi définissez-le.

  5. Paramétrez le schéma avec les trois colonnes : ID, Questions, Answers.

Paramétrer le composant de sortie

  1. Puis sélectionnez le composant tPivotToColumnsDelimited et paramétrez ses propriétés dans l'onglet Basic settings de la vue Component.

  2. Dans le champ Pivot column, sélectionnez la colonne pivot dans le schéma d'entrée. La colonne pivot est généralement celle présentant le plus de doublons (valeurs d'agrégation pivot).

  3. Dans le champ Aggregation column, sélectionnez la colonne à agréger dans le schéma d'entrée.

  4. Dans le champ Aggregation function, sélectionnez la fonction à effectuer lorsque des doublons sont trouvés.

  5. Dans la table Group by, ajoutez une entrée dans la colonne Input column, qui sera utilisée pour regrouper la colonne agrégée.

  6. Dans le champ File Name, indiquez le chemin d'accès et le nom du fichier de sortie. Et dans les champs Row et Field separator, paramétrez les séparateurs pour les lignes et données de sortie ayant été agrégées.

Sauvegarder et exécuter le Job

  1. Appuyez sur Ctrl+S pour sauvegarder votre Job.

  2. Appuyez sur F6 ou cliquez sur le bouton Run de la vue Run pour exécuter le Job.

Le fichier de sortie affiche les données qui viennent d'être agrégées.