Codes de vérification d'adresses dans le tLoqateAddressRow - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le composant tLoqateAddressRow écrit une colonne ACCURACYCODE en sortie. Cette colonne contient les codes de vérification pour les adresses traitées.

Le code de vérification se compose des valeurs suivantes :

Valeurs du code de vérification

Description

Statut de vérification

utilisé pour spécifier l'adresse postale complète du pays correspondant.

Niveau de correspondance de la vérification après traitement

utilisé pour spécifier les données d'entrée pour la ligne d'adresse du pays correspondant, divisées en lignes individuelles d'adresse.

Niveau de correspondance de la vérification avant traitement

utilisé pour spécifier l'adresse complète, y compris les retours à la ligne, sans les champs Organization, Locality, AdministrativeArea et PostalCode.

Statut de parsing (analyse)

utilisé pour spécifier les lignes individuelles contenues dans le champ DeliveryAddress.

Niveau de correspondance d'identification lexicale

utilisé pour fournir le nom ou le code du pays.

Niveau de correspondance d'identification du contexte

utilisé pour fournir le nom officiel du pays selon la norme ISO 3166.

Statut du code postal

utilisé pour fournir le code pays ISO 3166 à deux caractères.

Score de correspondance

utilisé pour fournir le code pays ISO 3166 à trois caractères.

Par exemple, le code de vérification V44-I44-P3-100 comprend :

  • Le statut de vérification = V (vérifié) : une correspondance complète a été trouvée entre l'adresse d'entrée et un enregistrement des données de référence disponibles.

  • Niveau de correspondance de la vérification après traitement = 4 (site) : le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles une fois que toutes les modifications et les ajouts effectués durant le processus de vérification ont été pris en compte.

  • Niveau de correspondance de la vérification avant traitement = 4 (site) : le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles avant tout ajout ou modification effectué(e) durant le processus de vérification.

  • Statut du parsing (analyse) = I (identifié et parsé) : tous les composants des données d'entrée ont pu être identifiés et placés dans des champs de sortie.

  • Niveau de correspondance de l'identification lexicale = 4 (site) : à l'aide d'une correspondance de modèle, une valeur numérique ou un mot a été identifié(e) comme numéro ou nom d'un site.

  • Niveau de correspondance d'identification du contexte = 4 (site) : à l'aide d'une forme moins précise de correspondance, une valeur numérique ou un mot a été identifié(e) comme numéro ou nom d'un site.

  • Statut du code postal = P3 (ajouté) : le code postal primaire pour le pays a été ajouté.

  • Score de correspondance = 100 (similarité parfaite) : les données d'entrée et leur correspondance la plus proche correspondent parfaitement.

Les sections suivantes expliquent de manière détaillée chaque segment du code de vérification.

Statut de vérification

Le statut de vérification peut être l'un des suivants :

Statut

Description

V (Vérifié)

L'adresse a été parsée et une correspondance exacte a été trouvée dans les données de référence pour tous les composants de l'adresse.

P (Partiellement vérifié)

Les données de référence contiennent plus de détails que les données d'entrée de l'adresse. L'adresse a été parsée et la plupart des composants de l'adresse ont été mis en correspondance avec les données de référence.

U (Non vérifié, de l'anglais Unverified)

Les données d'entrée n'ont pu être parsées. Les champs de sortie contiendront les données d'entrée.

A (Ambigu)

Plus d'un élément dans les données de référence correspond aux données d'entrée.

C (Conflit)

Les composants individuels d'adresse sont valides mais l'adresse n'est pas valide lors du regroupement des composants.

R (Annulé, de l'anglais Reverted)

L'adresse a été parsée et vérifiée, mais le niveau minimum acceptable de vérification n'a pas été atteint. Les champs de sortie contiendront les données d'entrée.

Niveau de correspondance de la vérification après traitement

Le niveau de correspondance de la vérification après traitement donne le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles une fois que toutes les modifications et les ajouts effectués durant le processus de vérification ont été pris en compte.

Niveau de correspondance

Description

5

point de livraison (boîte postale ou appartement).

4

site (site ou bâtiment).

3

type de voie.

2

localité.

1

zone administrative.

0

aucune.

Niveau de correspondance de la vérification avant traitement

Le niveau de correspondance de la vérification avant traitement donne le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles avant tout ajout ou modification effectué(e) durant le processus de vérification.

Niveau de correspondance

Description

5

point de livraison (boîte postale ou appartement).

4

site (site ou bâtiment).

3

type de voie.

2

localité.

1

zone administrative.

0

aucune.

Statut du parsing

Le statut du parsing peut être l'un des suivants :

  • I (identifié et parsé) : toutes les données d'entrées ont été identifiées et placées dans différents champs d'adresse.

  • U (impossible à parser, de l'anglais Unable to parse) : toutes les données d'entrées n'ont pas été identifiées et parsées.

Niveau de correspondance de l'identification lexicale

Le niveau de correspondance de l'identification lexicale permet de voir jusqu'à quel point les données d'entrée contiennent des formes reconnues, via l'utilisation :

  • d'une correspondance de modèle, par exemple une valeur numérique peut être le numéro d'un site et

  • d'une correspondance lexicale, par exemple rd peut être un type de voie Thoroughfare (road) et London peut être une Locality.

Niveau de correspondance

Description

5

point de livraison (boîte postale ou appartement).

4

site (site ou bâtiment).

3

type de voie.

2

localité.

1

zone administrative.

0

aucune.

Niveau de correspondance d'identification du contexte

Le niveau de correspondance d'identification du contexte permet de voir jusqu'à quel point les données d'entrée peuvent être reconnues selon le contexte dans lequel elles apparaissent.

Cette forme de mise en correspondance est la moins précise et se base sur l'identification d'un mot, par exemple un type de voie, Thoroughfare selon s'il est précédé par un site Premise et suivi par une localité Locality, ces derniers éléments étant identifiés par une correspondance par rapport aux données de référence ou au lexique.

Niveau de correspondance

Description

5

point de livraison (boîte postale ou appartement).

4

site (site ou bâtiment).

3

type de voie.

2

localité.

1

zone administrative.

0

aucune.

Statut du code postal

Le statut du code postal peut être l'une des valeurs suivantes :

Statut

Description

P8

Les champs PostalCodePrimary et PostalCodeSecondary sont vérifiés.

P7

Le champ PostalCodePrimary est vérifié et le champ PostalCodeSecondary est ajouté ou modifié.

P6

Le champ PostalCodePrimary est vérifié.

P5

Le champ PostalCodePrimary est vérifié et contient de légères modifications.

P4

Le champ PostalCodePrimary est vérifié et contient des modifications importantes.

P3

Le champ PostalCodePrimary est ajouté.

P2

Le champ PostalCodePrimary est identifié par le lexique.

P1

Le champ PostalCodePrimary est identifié par le contexte.

P0

Le champ PostalCodePrimary est vide.

Score de correspondance

La précision du score de correspondance montre le taux de similarité entre les données d'entrée et la correspondance la plus proche dans les données de référence, avec un pourcentage compris entre 0 et 100. 100 % signifie que la similarité est parfaite.