Propriétés du tSynonymOutput - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Famille du composant

Data Quality

 

Fonction

Le composant tSynonymOutput crée un index de Lucene et le remplit avec les entrées et les synonymes qu'il reçoit.

Pour plus d'informations concernant l'accès et la gestion des mots et des entrées de référence (documents) d'un synonyme existant, à l'aide de l'éditeur d'index des synonymes, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations concernant les index de synonymes disponibles, consultez l'annexe concernant les dictionnaires des synonymes de données dans le Guide utilisateur du Studio Talend.

Note

Le calcul de similarité des synonymes est amélioré en version 5.1 du Studio Talend. Si vos index ont été créés avec une version 5.0 ou antérieure et si vous devez les gérer à l'aide de cette méthode de calcul améliorée, vous devez mettre à jour ces index en exécutant le fichier IndexMigrator.jar téléchargeable à l'adresse : http://talendforge.org/svn/top/trunk/org.talend.dataquality.standardization.migration/dist/IndexMigrator.jar. La commande à utiliser pour exécuter ce fichier jar est

java -jar IndexMigrator.jar <inputPath> <outputPath(optional)> 

(où inputPath est le chemin d'entrée des jars à migrer et outputPath(optional) est l'emplacement de sortie facultatif des jars migrés).

Objectif

Le tSynonymOutput crée des index de synonymes auxquels certains composants comme le tStandardizeRow ou le tSynonymSearch peuvent renvoyer lors du traitement des données.

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

 

 

Built-in : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisable dans divers projets et Job designs. Voir également le Guide utilisateur du Studio Talend.

 

Index path

Saisissez le chemin d'accès, ou parcourez votre système et sélectionnez l'emplacement où vous souhaitez créer et stocker l'index de synonymes. Si le répertoire spécifié n'existe pas, le composant va le créer.

 

Operations

Sélectionnez l'opération d'index à effectuer dans le dossier spécifié dans le champ Index path.

(Delete and) initialize an index : cette opération crée un nouvel index et le remplit avec les entrées et les synonymes correspondants. Si un index existe déjà, supprimez-le avant d'en créer un nouveau.

Insert new documents : cette opération insère les nouvelles entrées dans l'index existant. Les synonymes en doublon n'y sont pas insérés.

Update existing documents and insert if not existing : cette opération met à jour les synonymes existants et ajoute les nouveaux synonymes dans l'index.

Delete existing documents : cette opération supprime les documents existants dans l'index.

 

Entry

Sélectionnez la colonne que vous souhaitez insérer pour créer les entrées de l'index.

 

Synonyms

Sélectionnez la colonne que vous souhaitez insérer pour créer les synonymes correspondants aux différentes entrées d'index.

 

Synonym separator

Renseignez le séparateur à utiliser pour séparer les synonymes de chaque entrée d'index. Par défaut, ce séparateur est |.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de process du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Connections

Liens de sortie (de ce composant à un autre) :

Row : Main; Reject

Trigger : Run if; On Component Ok; On Component Error.

Liens d'entrée (d'un autre composant à celui-ci) :

Row : Main; Reject

Pour plus d'informations concernant les connexions, consultez le Guide utilisateur de Studio Talend.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant requiert des données d'entrée provenant du composant précédent pour créer ou mettre à jour des index.