Propriétés du tFirstnameMatch - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Famille de composant

Data Quality

 

Fonction

Le composant tFirstnameMatch compare la colonne du flux d'entrée contenant des prénoms aux prénoms d'un index de référence fourni par Talend et écrit les prénoms qui correspondent.

L'index comprend des prénoms pour 162 pays et plus de 1000 prénoms de référence pour différents pays. Pour plus d'informations, consultez A propos de l'index de référence embarqué dans le tFirstnameMatch.

Objectif

Ce composant permet d'assurer une qualité de données des prénoms par rapport à un index de référence afin de standardiser les données.

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Une colonne en lecture seule, FIRSTNAMEMATCH est automatiquement ajoutée au schéma de sortie.

 

 

Built-in : Le schéma est créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisable dans divers projets et Job designs. Voir également le Guide utilisateur du Studio Talend.

 

First Names

Sélectionnez la colonne contenant les prénoms.

 

Use Gender

Ce paramètre est facultatif : cochez cette case puis sélectionnez dans la liste la colonne contenant le genre. Ceci optimisera les performances du système et donnera des résultats plus précis.

Les genres sont M (masculin) et F (Féminin).

 

Use Country

Ce paramètre est facultatif : cochez cette case puis sélectionnez dans la liste la colonne contenant les codes pays ISO 3166-1 alpha-3. Cela optimisera les performances de votre système et donnera des résultats plus précis.

 

Fuzzy Search

Cochez cette case si vous souhaitez obtenir la meilleure correspondance possible, y compris les correspondances approximatives.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de process du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est un composant intermédiaire et nécessite un composant d'entrée et un composant de sortie.

Limitation/prérequis

L'index utilisé pour standardiser les prénoms est intégré dans ce composant. Pour le moment, il est capable de gérer les noms latins.