Propriétés du tLoqateAddressRow Standard - 7.3

Standardisation d'adresses Loqate

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Loqate de standardisation d'adresses
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Loqate de standardisation d'adresses
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Loqate de standardisation d'adresses

Ces propriétés sont utilisées pour configurer le tLoqateAddressRow s'exécutant dans le framework de Jobs Standard.

Le composant tLoqateAddressRow Standard appartient à la famille Qualité de données.

Ce composant est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Basic settings

Schema

Un schéma est une description de lignes, il définit le nombre de champ qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in), soit distant dans le Repository.

 

Built-in : le schéma est créé et stocké localement pour ce composant seulement. Scénario associé : consultez le Guide d'utilisation du Studio Talend.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Scénario associé : consultez le Guide d'utilisation du Studio Talend.

Modifier le schéma

Cliquez sur le bouton [...] et définissez les schémas d'entrée et de sortie des données d'adresses.

Assurez-vous de définir dans le schéma de sortie toutes les colonnes nécessaires pour écrire en sortie les données formatés que vous souhaitez récupérer du tLoqateAddressRow.

Adresse d'entrée

Address field : ajoutez des lignes à la table et sélectionnez dans la liste des composants prédéfinis les champs qui contiendront les adresses d'entrée.

Le tLoqateAddressRow fournit une longue liste de champs individuels, car certains pays ont une structure d'adresses plus complexe que d'autres. Pour plus d'informations concernant les champs d'entrée, consultez Champs d'adresses dans le tLoqateAddressRow.

Input Column : ajoutez des lignes à la table et sélectionnez dans la liste les colonnes contenant les adresses d'entrée. Le schéma d'entrée peut contenir une ou plusieurs colonne(s) et même contenir des colonnes ne représentant pas de données d'adresses.

Adresse de sortie

Address field : ajoutez des lignes à la table et sélectionnez dans la liste des composants prédéfinis les champs qui contiendront les adresses de sortie. Le composant mappe les valeurs de ces champs vers les colonnes de sortie définies dans cette table.

Le tLoqateAddressRow fournit une longue liste de champs individuels, car certains pays ont une structure d'adresses plus complexe que d'autres. Pour plus d'informations concernant les champs de sortie, consultez Champs d'adresses dans le tLoqateAddressRow.

Output Column : ajoutez des lignes à la table et sélectionnez dans la liste les colonnes qui contiendront les adresses de sortie.

Si vous choisissez d'avoir une colonne de sortie dans la table Output Address ayant le nom exact d'une colonne d'entrée, la valeur de la colonne d'entrée sera écrasée par la valeur donnée par le composant tLoqateAddressRow.

Le schéma de sortie contient deux colonnes standard de sortie en lecture seule :

-STATUS : retourne le statut du traitement des adresses d'entrée. Pour plus d'informations concernant les statuts du traitement, consultez Statut du traitement dans le tLoqateAddressRow.

-ACCURACYCODE : retourne le code de vérification pour les adresses traitées. Pour plus d'informations concernant les valeurs dont se compose le code ainsi que les implications de chaque segment, consultez Codes de vérification d'adresses dans le tLoqateAddressRow.

Chemin des données Loqate

Configurez le chemin d'accès au Loqate Global Knowledge Repository fourni par Loqate et installé localement.

Vous devez commander et télécharger l'API Loqate Local et Global Knowledge Repository depuis http:// www.loqate.com/ (en anglais). Le composant tLoqateAddressRow utilise la version Q2.2 2016.

Advanced settings

Options du serveur

Configurez les options du serveur comme suit :

-Address Line Separator : définissez la chaîne de caractères séparant les composants d'adresse en sortie dans les champs d'adresse en sortie. Le séparateur par défaut est (<BR>).

-Default Country : sélectionnez le nom de pays pour lequel le code ISO 3166-1 alpha-3 doit être utilisé lors du parsing des données et si aucun pays identifiable n'est trouvé dans l'enregistrement d'entrée.

-Forced Country : sélectionnez le nom du pays pour lequel le code ISO 3166-1 alpha-3 doit être utilisé pour tous les enregistrements d'entrée lors du parsing des données.

-Output Script : utilisez cette option afin de translittérer l'adresse de sortie.

Sélectionnez Latin pour encoder les résultats du parsing en Latin, c'est-à-dire en caractères occidentaux.

Sélectionnez Native pour encoder les résultats du parsing à l'aide du script pays.

Ci-dessous se trouve une liste des jeux de caractères (scripts) et des langues que le tLoqateAddressRow peut translittérer :

Latn - Latin (caractères occidentaux),

Cyrl - Cyrillique (Russe),

Grek - Grec (Grèce)

Hebr - Hébreu (Israël),

Hani - Kanji (Japon),

Hans - Chinois simplifié (Chine),

Arab - Arabe (Emirats arabes unis),

Thai - Thaï (Thaïlande),

Hang - Hangeul (Corée du Sud),

Native - sortie écrite via le script natif quand possible.

-Minimum match score : spécifiez le score de correspondance minimum qu'un enregistrement doit atteindre pour ne pas être annulé. Les valeurs valides sont comprises entre 0 et 100.

Cette option est très utile lorsque vous souhaitez avoir, dans les champs de sortie, les données d'entrée, si un niveau donné de vérification (score de correspondance minimum) n'a pas été atteint.

tStat Catcher Statistics

Cochez cette case afin de collecter les données au niveau du composant.

Variables globales

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend .

Utilisation

Règle d'utilisation

Ce composant est un composant intermédiaire. Il nécessite un flux d'entrée et un flux de sortie.