Dénormaliser une colonne - 6.4

Processing (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
EnrichPlatform
Studio Talend

Procédure

  1. Cliquez et déposez les composants suivants : tFileInputDelimited, tDenormalize, tLogRow.
  2. Connectez ces composants à l'aide de liens Row main.
  3. Dans la vue Component du composant tFileInputDelimited, renseignez le chemin d'accès au fichier à dénormaliser.
  4. Dans les champs Header, Row Separator et Field Separator, renseignez respectivement le nombre de lignes d'en-tête, le type de séparateur de lignes et de champs.
  5. Le fichier d'entrée est composé de deux colonnes : Fathers et Children.
  6. Dans l'onglet Basic settings du tDenormalize, paramétrez la colonne contenant des valeurs multiples à regrouper. Dans le tableau To denormalize, sélectionnez la colonne Children.
  7. Dans cet exemple, la colonne Children est celle à dénormaliser.
  8. Dans le champ Delimiter, paramétrez le séparateur des valeurs regroupées. Attention, une seule colonne peut être dénormalisée.
  9. Cochez la case Merge same value si vous souhaitez supprimer les éventuels doublons.
  10. Enregistrez le Job et exécutez-le en appuyant sur F6.

Résultats

Toutes les valeurs de la colonne Children (définie comme colonne à dénormaliser) sont regroupées en fonction des valeurs de la colonne Fathers. Les valeurs sont séparées par des virgules.