Dénormaliser une colonne - Cloud - 8.0

Traitement (Processing) (Intégration)

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)

Procédure

  1. Déposez les composants suivants : un tFileInputDelimited, un tDenormalize, un tLogRow de la Palette vers l'espace de modélisation graphique.
  2. Reliez ces composants à l'aide de liens Row main.
  3. Dans la vue Component du composant tFileInputDelimited, renseignez le chemin d'accès au fichier à dénormaliser.
  4. Paramétrez les champs Header, Row Separator et Field Separator.
  5. Le schéma du fichier d'entrée est composé de deux colonnes : Parents et Children.
    Parents;Children
    Peter;John
    William;Mary
    Kate;Jack
    Chris;Liz
    Peter;Michael
    Kate;Caroline
  6. Dans l'onglet Basic settings du tDenormalize, paramétrez la colonne contenant des valeurs multiples à regrouper.
  7. Dans cet exemple, la colonne Children est celle à dénormaliser.
  8. Dans le champ Delimiter, paramétrez le séparateur des valeurs regroupées.
  9. Cochez la case Merge same value si vous souhaitez supprimer les éventuels doublons.
  10. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Résultats

Toutes les valeurs de la colonne Children sont regroupées en fonction des valeurs de la colonne Parents.

|Parents|Children     |
|=------+------------=|
|Kate   |Jack;Caroline|
|Chris  |Liz          |
|Peter  |John;Michael |
|William|Mary