Scénario : Dénormaliser une colonne

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Open Studio for Data Quality
Talend Open Studio for Data Integration
Talend Open Studio for Big Data
task
Qualité et préparation de données
Gouvernance de données
Création et développement
EnrichPlatform
Studio Talend

Ce scénario illustre un Job dénormalisant une colonne d'un fichier délimité via un composant de dénormalisation, et affichant le résultat dans la console.

  1. Cliquez et déposez les composants suivants : tFileInputDelimited, tDenormalize, tLogRow.

  2. Connectez ces composants à l'aide d'un lien Row main.

  3. Dans la vue Component du composant tFileInputDelimited, renseignez le chemin d'accès au fichier à dénormaliser.

  4. Dans les champs Header, Row Separator et Field Separator, renseignez respectivement le nombre de lignes d'en-tête, le type de séparateur de lignes et de champs.

  5. Le fichier d'entrée est composé de deux colonnes : Fathers et Children.

  6. Dans l'onglet Basic settings du tDenormalize, paramétrez la colonne contenant des valeurs multiples à regrouper. Dans le tableau To denormalize, sélectionnez la colonne Children.

  7. Dans cet exemple, la colonne Children est celle à dénormaliser.

  8. Dans le champ Delimiter, paramétrez le séparateur des valeurs regroupées. Attention, une seule colonne peut être dénormalisée.

  9. Cochez la case Merge same value si vous souhaitez supprimer les éventuels doublons.

  10. Enregistrez le Job et exécutez-le en appuyant sur F6.

Toutes les valeurs de la colonne Children (définie comme colonne à dénormaliser) sont regroupées en fonction des valeurs de la colonne Fathers. Les valeurs sont séparées par des virgules.