Paramétrer un argument JVM et finaliser le Job - 7.0

Loqate address standardization

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Loqate de standardisation d'adresses
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Loqate de standardisation d'adresses
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses > Composants Loqate de standardisation d'adresses
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le composant tFileOutputExcel pour afficher sa vue Basic settings.
  2. Configurez le chemin d'accès, dans le champ File Name ainsi que le nom de la feuille, dans le champ Sheet name et cochez les cases Include header et Define all columns auto size.
  3. Cliquez sur l'onglet Run puis sur la vue Advanced settings.
  4. Cochez la case Use specific JVM arguments et cliquez sur New....
  5. Dans la fenêtre qui s'ouvre, configurez l'argument JVM suivant : -Djava.library.path=<path/to/lqtjava.dll/folder/>.
    Dans cet argument, vous devez indiquer le dossier où est installée la bibliothèque Loqate, nommée liblqtjava.so sous Linux ou lqtjava.dll sous Windows.
    Sans le bon argument JVM configuré, l'erreur suivante est attendue : java.lang.Error: java.lang.UnsatisfiedLinkError.
  6. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.
    Le composant tLoqateAddressRow lit les données des adresses d'entrée. Il parse, vérifie, nettoie, standardise les adresses et donne les résultats dans les lignes de sortie définies dans le schéma de sortie.
    Le tLoqateAddressRow met en correspondance les adresses d'entrée par rapport au fichier de données Loqate téléchargé localement.
    La colonne de sortie STATUS standard retourne le statut psOK pour toutes les lignes d'adresses. Cela signifie que le processus de vérification de toutes les lignes d'adresses peut s'effectuer normalement via le composant. Pour plus d'informations concernant le statut du processus, consultez Statut du traitement dans le tLoqateAddressRow.
    La colonne de sortie ACCURACYCODE standard retourne un code de vérification pour chacune des lignes d'adresse traitée. Par exemple, le premier code de vérification, V44-I45-P7-100, signifie :
    • Le statut de vérification = V (vérifié) : une correspondance complète a été trouvée entre l'adresse d'entrée et un enregistrement des données de référence disponibles.
    • Niveau de correspondance de la vérification après traitement = 4 (site) : le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles une fois toutes les modifications et les ajouts effectués durant le processus de vérification ont été pris en compte.
    • Niveau de correspondance de la vérification avant traitement = 4 (site) : le niveau de correspondance des données d'entrée par rapport aux données de référence disponibles avant tout ajout ou modification effectué(e) durant le processus de vérification.
    • Statut du parsing (analyse) = I (identifié et parsé) : tous les composants des données d'entrée ont pu être identifiés et placés dans des champs de sortie.
    • Niveau de correspondance de l'identification lexicale = 4 (site) : à l'aide d'une correspondance de modèle, une valeur numérique ou un mot a été identifié(e) comme numéro ou nom d'un site.
    • Niveau de correspondance d'identification du contexte = 5 (point de livraison, boîte postale ou appartement) : une valeur numérique ou un mot a été identifié comme numéro de boîte postale ou comme nom d'appartement.
    • Statut du code postal = P7 (ajouté) : le code postal primaire du pays a été vérifié et un second code postal a été ajouté.
    • Score de correspondance = 100 (similarité parfaite) : les données d'entrée et leur correspondance la plus proche correspondent parfaitement.
    Pour plus d'informations concernant les valeurs dont se compose le code ainsi que les implications de chaque segment, consultez Codes de vérification d'adresses dans le tLoqateAddressRow.