tReplaceList

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Open Studio for Data Quality
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
task
Gouvernance de données
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Fonction

Le tReplaceList effectue un rechercher/remplacer dans les colonnes d'entrée spécifiées en fonction des données de référence (lookup).

Objectif

Ce composant permet de nettoyer tous les fichiers avant un traitement futur.

Propriétés du tReplaceList

Famille de composant

Data Quality

 

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Deux colonnes en lecture seule, Value et Match sont automatiquement ajoutés au schéma de sortie.

Avertissement

Le type de données défini dans les schémas doit être cohérent, c'est-à-dire qu'un entier ne peut être remplacé que par un entier en utilisant un entier comme champ de référence. Une valeur d'un type ne peut être remplacée par une valeur d'un autre type.

 

 

Built-in : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

 

Lookup search column

Sélectionnez la colonne à rechercher dans le schéma de lookup.

 

Lookup replacement column

Sélectionnez la colonne dans laquelle les valeurs de remplacement sont stockées.

 

Column options

Sélectionnez les colonnes du flux principal dans lequel le remplacement est effectué.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de process du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est un composant intermédiaire, il nécessite un composant d'entrée et un composant de sortie.

Scénario : Remplacement à partir d'un fichier de référence

Le Job suivant recherche et remplace une liste d'états par le code à deux lettres correspondant. Les codes correspondants proviennent d'un fichier de référence placé dans le flux lookup du Job.

Construire le Job

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : deux tFileInputDelimited, un tReplaceList et un tLogRow.

  2. Reliez les deux tFileInputDelimited au tReplaceList à l'aide de liens Row > Main. Notez que le lien entre le composant de référence (le second tFileInputDelimited) et le tReplaceList apparaît comme lien Lookup.

  3. Reliez le composant tReplaceList au tLogRow à l'aide d'un lien Row > Main.

Configurer les composants

  1. Double-cliquez sur le premier tFileInputDelimited pour ouvrir sa vue Basic settings et configurer les paramètres du flux d'entrée principal, notamment le chemin d'accès au fichier à lire, ainsi que le nombre de lignes d'en-tête à ignorer.

    Dans cet exemple, le fichier principal d'entrée fournit une liste de personnes et d'états des Etats-Unis. Voici un extrait du fichier :

    name;state
    Andrew Kennedy;Mississippi
    Benjamin Carter;Louisiana
    Benjamin Monroe;West Virginia
    Bill Harrison;Tennessee
    Calvin Grant;Virginia
    Chester Harrison;Rhode Island
    Chester Hoover;Kansas
    Chester Kennedy;Maryland
    Chester Polk;Indiana
    Dwight Nixon;Nevada
    Dwight Roosevelt;Mississippi
    Franklin Grant;Nebraska
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue [Schema] et configurer le schéma d'entrée.

    Selon la structure du fichier d'entrée principal, le schéma d'entrée doit contenir deux colonnes : name et state.

    Cliquez sur OK pour fermer la boîte de dialogue et propager les modifications au composant suivant.

  3. Configurez de la même façon les propriétés du second tFileInputDelimited.

    Dans cet exemple, le fichier de référence fournit une liste d'états ainsi que leur code à deux lettres. Le schéma de référence doit donc comprendre deux colonnes : state et code.

  4. Double-cliquez sur le tReplaceList pour ouvrir sa vue Basic settings et paramétrer l'opération à effectuer.

  5. Dans la liste Lookup search column, sélectionnez la colonne à rechercher. Dans ce scénario, recherchez la colonne state.

  6. Dans la liste Lookup replacement column, sélectionnez la colonne contenant les valeurs de remplacement, code pour les codes à deux lettres des états, dans cet exemple.

  7. Dans la table Column options, cochez la case Replace pour la colonne states, afin de remplacer le nom des états par le code correspondant.

  8. Dans le composant tLogRow, sélectionnez l'option Table pour une meilleure lisibilité de la sortie.

Exécuter le Job

  • Sauvegardez le Job et appuyez sur F6 pour l'exécuter.

    Le nom des états a été remplacé par le code à deux lettres correspondant.