tSplitRow - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tSplitRow

Famille de composant

Processing/Fields

 

Fonction

Le composant tSplitRow découpe une ligne en plusieurs lignes.

Objectif

Ce composant vous permet de séparer une ligne d'entrée en plusieurs lignes de sortie.

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in) , soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

 

 

Built-in : Le schéma sera créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Voir également le Guide utilisateur du Studio Talend.

 

Columns mapping

Cliquez sur le bouton [+] pour ajouter autant de lignes que nécessaire pour effectuer le mapping des colonnes d'entrée vers les colonnes de sortie.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant découpe une ligne d'entrée en de multiples lignes de sortie, en mappant les colonnes d'entrée vers les colonnes de sortie.

Scénario 1 : Séparer une ligne en plusieurs lignes

Ce scénario décrit un Job a trois composants. Une ligne de données contenant des informations concernant deux entreprises sera séparée en deux lignes.

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : tFixedFlowInput, tSplitRow et tLogRow.

  2. Reliez-les à l'aide de liens Row Main.

  3. Double-cliquez sur le tFixedFlowInput afin d'ouvrir sa vue Basic settings.

  4. Sélectionnez Use Inline Content(delimited file) dans la zone Mode.

  5. Dans la zone Content, saisissez les scripts suivants :

    Talend;LA;California;537;5thAvenue;IT;Lionbridge;Memphis;Tennessee;537;Lincoln Road;IT Service;

  6. Cliquez sur Edit schema pour ouvrir une boîte de dialogue afin d'éditer le schéma des données d'entrée.

  7. Cliquez sur le bouton [+] pour ajouter douze colonnes d'entrée : Company, City, State, CountryCode, Street, Industry, Company2, City2, State2, CountryCode2, Street2 et Industry2.

  8. Cliquez sur OK pour fermer la boîte de dialogue.

  9. Double-cliquez sur le composant tSplitRow afin d'ouvrir sa vue Basic settings.

  10. Cliquez sur Edit schema pour configurer le schéma des données de sortie.

  11. Cliquez sur le bouton [+] sous la table tSplitRow_1(Output) affin d'ajouter quatre colonnes de sortie : Company, CountryCode, Address et Industry.

  12. Cliquez sur OK pour fermer la boîte de dialogue. Une table vide contenant le nom des colonnes définies dans l'étape précédente apparaît dans la zone Columns mapping :

  13. Cliquez sur le bouton [+] sous la table Columns mapping afin d'ajouter deux lignes de sortie.

  14. Renseignez la table Columns mapping en saisissant les valeurs suivantes dans les colonnes :

    Company: row1.Company, row1.Company2;

    Country: row1.CountryCode, row1.CountryCode2;

    Address: row1.Street+","+row1.City+","+row1.State, row1.Street2+","+row1.City2+","+row1.State2;

    Industry: row1.Industry, row1.Industry2;

    Note

    La valeur dans la colonne Address, par exemple, row1.Street+","+row1.City+","+row1.State, affiche une adresse absolue en combinant les valeurs des colonnes Street, City et State. "row1" utilisé dans les valeurs de chaque colonne fait référence à la ligne d'entrée du tFixedFlowInput.

  15. Double-cliquez sur le tLogRow afin d'ouvrir sa vue Basic settings.

  16. Cliquez sur le bouton Sync columns pour récupérer le schéma défini dans le composant précédent.

  17. Sélectionnez Table (print values in cells of a table) dans la zone Mode.

  18. Sauvegardez le Job et appuyez sur F6 pour l'exécuter.

Les données d'entrée en une ligne sont séparées en deux lignes différentes, chaque ligne contenant es informations d'une des deux entreprises.