Configurer le composant de sortie et exécuter le Job

Address standardization

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
Talend MDM Platform
Talend Data Fabric
Talend Data Services Platform
Talend Big Data Platform
Talend Data Management Platform
task
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
EnrichPlatform
Studio Talend
  1. Double-cliquez sur le composant tFileOutputExcel pour afficher sa vue Basic settings et définir les propriétés du composant.
  2. Définissez le nom du fichier de destination ainsi que le nom de la feuille, puis cochez la case Define all columns auto size.
  3. Enregistrez votre Job et appuyez sur F6 pour l'exécuter.
    Le composant tAddressRowCloud transfère les données dans le Cloud, récupère les données corrigées et écrit le résultat dans le fichier de sortie.
  4. Cliquez-droit sur le composant de sortie et sélectionnez Data Viewer pour afficher les données des adresses formatées.
    Le composant tAddressRowCloud fait correspondre les données des adresses d'entrée aux données du référentiel Loqate.
    Les colonnes all_info et Geo_info récupèrent les informations des adresses supplémentaires des colonnes Raw_Response et GeoAccuracy, respectivement, dans le référentiel Loqate. La colonne Raw_Response vous fournit toutes les informations d'adresses du référentiel de votre fournisseur sans les formater. Si vous souhaitez que les informations soient plus lisibles, vous devez les parser avec JSON ou XML.
    La colonne de sortie STATUS retourne le statut OK pour toutes les lignes d'adresses. Cela signifie que le processus de vérification de toutes les lignes d'adresses peut s'effectuer normalement via le composant. Pour plus d'informations concernant le statut du processus, consultez Statut du traitement dans le tLoqateAddressRow.
    La colonne de sortie VerificationLevel fournit un statut de vérification des adresses traitées. Pour plus d'informations, consultez Statut de vérification.
    La colonne de sortie AddressVerificationCode retourne un code de vérification pour chacune des lignes d'adresse traitée. Par exemple, le premier code de vérification, V44-I45-P3-100, signifie :
    • Le statut de vérification = V (vérifié) : une correspondance complète a été trouvée entre l'adresse d'entrée et un enregistrement des données de référence disponibles.

    • Niveau de correspondance de la vérification après traitement = 4 (site) : le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles une fois toutes les modifications et les ajouts effectués durant le processus de vérification ont été pris en compte.

    • Niveau de correspondance de la vérification avant traitement = 4 (site) : le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles avant tout ajout ou modification effectué(e) durant le processus de vérification.

    • Statut du parsing (analyse) = I (identifié et parsé) : tous les composants des données d'entrée ont pu être identifiés et placés dans des champs de sortie.

    • Niveau de correspondance de l'identification lexicale = 4 (site) : à l'aide d'une correspondance de modèle, une valeur numérique ou un mot a été identifié(e) comme numéro ou nom d'un site.

    • Niveau de correspondance d'identification du contexte = 5 (point de livraison, boîte postale ou appartement) : une valeur numérique ou un mot a été identifié comme numéro de boîte postale ou comme nom d'appartement.

    • Statut du code postal = P3 (ajouté) : le code postal primaire du pays a été ajouté.

    • Correspondance = 100 (similarité parfaite) : les données d'entrée et leur correspondance la plus proche correspondent parfaitement.

    Pour plus d'informations concernant les valeurs dont se compose ce code et les implications de chaque segment, consultez Codes de vérification d'adresses dans le tLoqateAddressRow.