Propriétés du tPersonator Standard - 7.3

Standardisation d'adresses Melissa Data

Version
7.3
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Melissa Data de standardisation d'adresses
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Melissa Data de standardisation d'adresses
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Melissa Data de standardisation d'adresses
Last publication date
2024-02-22

Ces propriétés sont utilisées pour configurer le tPersonator s'exécutant dans le framework de Jobs Standard.

Le composant tPersonator Standard appartient à la famille Qualité de données.

Basic settings

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant.

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Sélectionnez le type de schéma dans la liste Schema :
  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

View schema : sélectionnez cette option afin de voir uniquement le schéma.

Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Le seul type de données supporté est String.

Le schéma de sortie de ce composant comporte des colonnes en lecture seule. Pour plus d'informations, consultez la liste des colonnes de sortie.

Input Mapping Associez Personator field et Input column.

Important : lorsqu'une colonne d'entrée n'est pas définie dans la table Input mapping, les colonnes de sortie correspondantes sont vides.

Actions Sélectionnez les actions à effectuer :
  • Check action : standardise les données et assure qu'elles sont valides. Cette action analyse chaque donnée séparément. Par exemple, si le code postal ne correspond pas à la ville, la fonction Check action le corrige, sans affecter les autres données.
  • Verify action : assure que les données différentes sont associées les unes aux autres. Cette action analyse les données en tant qu'ensemble. Par exemple, si vous effectuez cette action sur les adresses, la fonction Verify action vérifie si l'adresse est associée au même nom, numéro de téléphone et adresse e-mail dans d'autres bases de données.
  • Move action : récupère la dernière adresse. La base de données doit au moins contenir le nom de famille ou le nom de l'entreprise et une adresse.
  • Append action : ajoute les données manquantes.
Selon l'action, certaines entrées sont obligatoires.
Centric hint Disponible si vous sélectionnez Append action ou Verify action.
Sélectionnez une donnée de référence :
  • Auto : utiliser l'adresse comme donnée de référence. Si elle n'est pas disponible, le numéro de téléphone est utilisé. S'il n'est pas disponible, l'adresse e-mail est utilisée. Si elle n'est pas disponible, le numéro de Sécurité Sociale est utilisé.
  • Address
  • Phone
  • Email
  • SSN

    Ces données de référence sont disponibles si vous sélectionnez Verify action.

Append options Disponibles si vous sélectionnez Append action.
Sélectionnez une action :
  • Blank : écrire les données à la suite lorsque votre base de données ne contient pas d'adresse, de numéro de téléphone, d'adresse e-mail ou de nom d'entreprise.
  • Check error : écrire les données à la suite lorsqu'une erreur survient à l'adresse, au numéro de téléphone, à l'adresse e-mail, au nom ou à l'entreprise :
    • Une erreur d'adresse survient lorsque l'adresse est introuvable dans la base de données, est partiellement vérifiée ou ne peut être corrigée. Le composant ne retourne pas les codes de résultat : AS01, AS02, ou AS03. Pour plus d'informations concernant ces codes de résultats, consultez ce tableau descriptif (en anglais).

    • Une erreur de numéro de téléphone survient lorsqu'un numéro de téléphone ne contient ni 7 ni 10 chiffres. Le composant ne retourne pas les codes de résultat : PS01 ou PS02. Pour plus d'informations concernant ces codes de résultats, consultez ce tableau descriptif (en anglais).

    • Une erreur d'adresse e-mail survient lorsque l'adresse e-mail est introuvable dans la base de données ou si l'adresse e-mail n'est pas confirmée. Le composant ne retourne pas les codes de résultat : ES01 ou ES03. Pour plus d'informations concernant ces codes de résultats, consultez ce tableau descriptif (en anglais).

    • Une erreur de nom survient lorsque le nom n'a pas été parsé correctement. Le composant ne retourne pas le code de résultat : NS01. Pour plus d'informations concernant ce code de résultats, consultez ce tableau descriptif (en anglais).
    • Une erreur d'entreprise survient lorsque le nom de l'entreprise n'est pas fourni.
  • Always : écrire les données à la suite, même si l'adresse, le numéro de téléphone, l'adresse e-mail, le nom ou l'entreprise est vide ou incorrect(e) dans votre base de données.
Address options Diacritics : auto, on ou off. Configurez à on pour retourner les caractères français. Si l'option est configurée à auto, ces caractères sont retournés s'ils sont présents dans votre base de données.

Advanced address correction : effectuer une correction avancée de l'adresse. L'option utilise le nom complet ou le nom de l'entreprise et peut corriger ou écrire à la suite le numéro de l'adresse, le nom de la rue, la ville, l'État et le code postal.

Use preferred city : utiliser le nom de ville suggéré par les services postaux.

Name options Name hint
  • Definitely full : traiter le nom dans cet ordre : prénom, deuxième prénom, nom de famille, sans se soucier de la ponctuation ou du formatage.
  • Very likely full : traiter le nom dans cet ordre : prénom, deuxième prénom, nom de famille, sauf si l'ordre est indiqué par le formatage ou la ponctuation.
  • Probably full : laisser la logique statistique déterminer l'ordre des noms, en se basant sur cet ordre : prénom, deuxième prénom, nom de famille.
  • Varying : laissez la logique statistique déterminer l'ordre des noms, sans ordre prédéfini :
  • Probably inverse : laisser la logique statistique déterminer l'ordre des noms, en se basant sur cet ordre : nom de famille, deuxième prénom, prénom.
  • Very likely inverse : traiter le nom dans cet ordre : nom de famille, deuxième prénom, prénom, sauf si l'ordre est indiqué par le formatage ou la ponctuation.
  • Definitely inverse : traiter le nom dans cet ordre : nom de famille, deuxième prénom, prénom, sans se soucier de la ponctuation ou du formatage.
  • Mixed first name : choisissez cette option si le nom de famille est manquant. Le champ du nom ne doit contenir que des préfixes, un prénom et un deuxième prénom.
  • Mixed last name : choisissez cette option si prénom et le deuxième prénom sont manquants. Le champ du nom ne doit contenir que des noms de famille et des suffixes.
Middle name logic
  • Parse logic : considérer le deuxième prénom comme partie du nom de famille. Cela arrive lorsque le deuxième prénom est un nom de famille commun. Dans ce cas, un tiret est ajouté au nom de famille.
  • Hyphenated last : considérer le deuxième mot comme une partie du nom de famille.
  • Middle name : considérer le second mot comme deuxième prénom.
Salutation format : sélectionnez le format de salutation. Par exemple, John Smith :
  • Formal : Mr. Smith
  • Informal : John
  • First/Last : John Smith
Gender population : Mixed, Male, Female Sélectionnez le genre prédominant dans votre base de données.

Genderization policy : Neutral, Conservative, Aggressive. Pour plus d'informations concernant cette option, consultez le tableau des résultats.

Pour voir les informations Name options précédentes, dans les colonnes de sortie, cochez la case Name details dans Miscellaneous outputs.

Correct first name : corriger l'orthographe du prénom.

Standardize company : appliquer la casse de titre et abréger le nom de l'entreprise. Par exemple, melissa data corporation est remplacé par Melissa Data Corp..
Email options Database lookup : vérifier les noms de domaines à l'aide d'une base de données de domaines valides.

Standardize case : passer en minuscules les caractères des adresses e-mail avant toute action.

Correct syntax : corriger la syntaxe de l'adresse e-mail. Cette option supporte une syntaxe d'adresse e-mail simple : partie locale + @ + domaine + ‘.’ + domaine de haut niveau. Par exemple, jsmith@domain,coj est remplacé par jsmith@domain.com.

Update domain : mettre à jour le nom de domaine s'il n'est plus à jour.

Address outputs Basic (Default) : retourner l'adresse simple. Ce paramètre est toujours activé.

Address details : retourner l'adresse détaillée.

Plus4 : retourner le code +4.

Private mailbox : retourner le numéro de boîte aux lettres privée. Ces boîtes aux lettres sont les boîtes aux lettres privées dans les agences recevant du courrier commercial.

Suite : retourner le numéro d'appartement.

Parsed address : retourner l'adresse détaillée.

Geographics outputs Census : retourner les informations relatives au recensement.

Census 2 : retourner plus d'informations relatives au recensement.

Geocode : retourner le géocode.

Miscellaneous outputs Demographic details : retourner une chaîne de caractères contenant tous les résultats démographiques. Les résultats sont séparés par des virgules.

Name details : retourner les détails du nom comme le genre, la formule de politesse...

Parsed email : retourner les détails de l'adresse e-mail, comme le nom de domaine, le nom de la boîte e-mail...

Parsed phone : retourner les détails du numéro de téléphone comme l'extension, le préfixe...

Selon l'action, certaines entrées sont obligatoires.
Action Entrées obligatoires
Check La base de données doit contenir au moins l'un des éléments suivants :
  • adresse et code postal
  • adresse et ville ou État
  • numéro de téléphone
  • adresse e-mail
  • nom complet
  • prénom et nom de famille
Verify La base de données doit contenir au moins deux des éléments suivants :
  • adresse et code postal ou adresse, ville et État
  • numéro de téléphone
  • adresse e-mail
  • nom complet ou nom de famille ou prénom et nom de famille
  • nom de l'entreprise
Si la base de données contient uniquement des noms et des noms d'entreprises, vous ne pouvez effectuer l'action Verify. Les résultats ne sont jamais trop précis.
Move La base de données doit contenir au moins l'un des éléments suivants :
  • adresse et nom complet
  • adresse, prénom et nom de famille
  • adresse et nom d'entreprise
Append Les entrées obligatoires dépendent des données à écrire la suite.
Pour écrire à la suite un nom ou un nom d'entreprise, la base de données doit contenir au moins l'un des éléments suivants :
  • adresse, ville et État ou adresse et code postal
  • numéro de téléphone
  • adresse e-mail
Pour écrire une adresse à la suite, la base de données doit contenir au moins l'un des éléments suivants :
  • numéro de téléphone
  • adresse e-mail
Pour écrire un numéro de téléphone à la suite, la base de données doit contenir au moins l'un des éléments suivants :
  • adresse, ville et État ou adresse et code postal
  • adresse e-mail
Pour écrire une adresse e-mail à la suite, la base de données doit contenir au moins l'un des éléments suivants :
  • adresse, ville et État ou adresse et code postal
  • numéro de téléphone

Paramètres avancés

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

License key

Pour saisir une clé de licence, cliquez sur le bouton […] à côté du champ.

Si vous n'avez pas de clé de licence, contactez Melissa Data.
Number of retries Définissez le nombre d'essais avant que le Job ne soit mis en échec.
Timeout in seconds Définit la durée avant expiration.
Cache directory Parcourez le répertoire du cache dans Cache Directory.
Batch request size (1-100) Définissez le nombre de messages à livrer dans chaque lot.
Multithreading Choisissez d'utiliser un ou plusieurs thread(s) dans le même Job pour gérer la réponse du service Melissa Data.
Thead count (1-10) Définissez le nombre maximal de threads.
Show debug console output Afficher la sortie de débogage de la console.