tUniservRTPost - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tUniservRTPost

Famille de composant

Data Quality

 

Fonction

Le composant tUniservRTPost fournit un service de validation postale et de correction d'adresses, critique pour améliorer la qualité des adresses. Grâce à ce composant, vous serez plus efficace dans le marketing individualisé, réduisant les coûts et augmentant l'efficacité de la gestion des adresses dans toutes les applications.

Objectif

Le composant tUniservRTPost est conçu pour améliorer la qualité des adresses, ce qui est extrêmement important pour la GRC et le e-commerce : cela est directement lié aux coûts du courrier et de la publicité.

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier dans lequel sont stockées les propriétés du composant. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

 

Host name

Nom de l'hôte du serveur, entre guillemets doubles.

 

Port

Numéro du port d'écoute du serveur, entre guillemets doubles.

 

Service

Le nom du service est "post" par défaut. Saisissez un nouveau nom si nécessaire (suffixe du service par exemple), entre guillemets doubles.

 

Use rejects

Cochez cette case pour collecter les adresses incorrectes via la connexion rejects. Il s'agit habituellement des adresses de classe 5. Les valeurs valides pour les classes de résultat vont de 1 à 5. La valeur doit être entre guillemets doubles.

Si cette case n'est pas cochée, les adresses incorrectes sont écrites en sortie via la connexion Main.

Si cette case est cochée mais que la connexion rejects n'est pas créée, les adresses incorrectes sont simplement rejetées.

 

Use File for ambiguous results

Cochez cette case pour définir un fichier qui servira à écrire la liste des résultats ambigus.

Lorsqu'une adresse ne peut être corrigée de manière certaine, une liste de résultats ambigus est créée.

Cette liste peut par la suite être traitée via la connexion AMBIGUITY. Tous les résultats potentiellement candidats sont redirigés via cette connexion. Le schéma de cette connexion est pré-initialisé avec les arguments de la liste de sélection dissoute du service 'post'.

Advanced settings

Uniserv Parameters

Cochez cette case pour définir les paramètres correspondants. Pour plus d'informations, veuillez vous référer au manuel Uniserv International Postal Framework.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job et de chaque composant.

 

"Full address" selection list

Cochez la case Display pour afficher toutes les colonnes. Vous pouvez également cocher la case d'une colonne en particulier pour n'afficher qu'elle.

Cette option contrôle le contenu du fichier des adresses incertaines. Seules les colonnes sélectionnées seront écrites dans le fichier.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Le composant tUniservRTPost requiert une liste d'adresses en entrée. Les données concernant les adresses sont ensuite vérifiées. Si la liste ne contient que des résultats non ambigus, elle est écrite en sortie via la connexion Main. Si l'adresse est ambigüe, les candidats potentiels sont écrits en sortie via la connexion Ambiguity. Si une adresse n'a pas pu être trouvée, elle sera transférée via la connexion Reject.

Limitation

Pour utiliser le composant tUniservRTPost, le logiciel Uniserv International Postal Framework et les serveurs dédiés doivent être installés.

Scénario 1 : Vérifier et corriger le code postal, la ville et la rue

Ce scénario décrit un Job qui vérifie et corrige les adresses et les codes postaux d'un fichier.

Le fichier d'entrée de ce scénario est déjà sauvegardé dans le Repository, les schémas de métadonnées sont donc disponibles.

  1. Dans la vue Repository, développez le nœud Metadata et le répertoire dans lequel le fichier est sauvegardé. Glissez ce fichier dans l'espace de modélisation graphique.

    La boîte de dialogue suivante apparaît :

  2. Sélectionnez le composant tFileInputDelimited et cliquez sur OK pour fermer la boîte de dialogue.

    Le composant s'affiche dans l'espace de modélisation graphique. Le fichier utilisé dans ce scénario se nomme SampleAddresses. Il contient des adresses comprenant un code pays. La rue et le numéro sont sauvegardés ensemble dans le champ Street et le code postal et la ville sont sauvegardés dans des champs séparés.

  3. Glissez les composants suivants de la Palette dans l'espace de modélisation graphique : deux composants tMap, un composant tUniservRTPost et un tFileOutputDelimited.

  4. Connectez le tMap au tUniservRTPost à l'aide d'un lien Row > Main.

    Acceptez le schéma du tUniservRTPost en cliquant sur Yes dans la fenêtre proposant la propagation.

  5. Connectez les autres composants à l'aide de liens Row > Main.

  6. Double-cliquez sur le tMap_1 pour ouvrir la fenêtre de mapping du schéma. Sur la gauche se trouve la structure du fichier d'entrée et sur la droite le schéma du tUniservRTPost. En bas se trouve le Schema Editor, où vous pouvez trouver et éditer les attributs de chaque colonne.

  7. Mappez les colonnes du fichier d'entrée à leurs colonnes respectives dans le tUniservRTPost. Pour ce faire, sélectionnez une colonne de la source et glissez-la sur la colonne appropriée du côté droit. Si des champs du fichier d'entrée doivent être passés au fichier de sortie, comme les noms ou les IDs, de nouveaux champs doivent être définis.

    Note

    Au moment de mapper les champs, notez que la rue et le numéro peuvent être enregistrés soit ensemble dans la colonne Street, soit dans des champs séparés. Si votre liste d'adresses ne comporte pas de code pays mais que les adresses proviennent d'un même pays, vous devrez saisir manuellement le code ISO du pays correspondant entre guillemets doubles dans la colonne IN_COUNTRY. Dans le cas d'une liste d'adresses internationales sans code pays, laissez la colonne IN_COUNTRY vide. Pour plus d'informations, veuillez vous référer au guide utilisateur Uniserv International Postal Framework.

  8. Cliquez sur OK pour fermer la fenêtre.

  9. Double-cliquez sur le composant tUniservRTPost et ouvrez sa vue Advanced settings.

  10. Changez les paramètres et les longueurs de champs si nécessaire et sélectionnez les champs de sortie.

    Note

    Assurez-vous d'avoir défini une longueur suffisante de champ. Pour plus de précisions, veuillez vous référer au Guide utilisateur Uniserv International Postal Framework.

  11. Double-cliquez sur le second composant tMap pour ouvrir la fenêtre de mapping du schéma. Sur la gauche se trouve le schéma du tUniservRTPost et sur la droite le schéma du fichier de sortie.

  12. Cliquez sur OK pour fermer la boîte de dialogue.

  13. Double-cliquez sur le composant tFileOutputDelimited pour saisir les détails du fichier de sortie.

Scénario 2 : Vérifier et corriger le code postal, la ville et la rue, tout en rejetant les données incorrectes

Ce scénario est étroitement lié au précédent à ceci près que les adresses qui ne peuvent être assignées sont écrites dans un champ à part pour une vérification manuelle. De plus, pour écrire des adresses ambiguës dans un fichier séparé, la procédure est la même que celle décrite ici.

  1. Créez un Job comme décrit dans le scénario précédent.

  2. Glissez les composants suivants de la Palette dans l'espace de modélisation graphique : un tMap et un tFileOutputDelimited.

  3. Double-cliquez sur le composant tUniservRTPost pour ouvrir sa vue Basic settings.

  4. Cochez la case Use rejects et saisissez "5" dans le champ if result class greater or equals to. Il s'agit de la classe de résultat de la vérification des codes postaux dans les adresses contenant des données incorrectes ou insuffisantes.

  5. Connectez le composant tUniservRTPost au tMap_5 à l'aide d'un lien Row > Rejects.

  6. Connectez le tMap au tFileOutputDelimited à l'aide d'un lien Row > Main.