Parser des adresses par rapport aux données de MelissaData

Address standardization

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
Talend MDM Platform
Talend Data Fabric
Talend Data Services Platform
Talend Big Data Platform
Talend Data Management Platform
task
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
EnrichPlatform
Studio Talend

Vous pouvez exécuter le Job de Scénario : Parser les adresses par rapport aux données de référence dans le Cloud par rapport aux données du référentiel MelissaData en procédant de la manière suivante :

  1. Dans la vue Basic settings du tFixedFlowInput, créez le schéma en cliquant sur le bouton Edit schema.
    Dans la boîte de dialogue qui s'ouvre, cliquez sur le bouton [+] et ajoutez une colonne qui contiendra les informations des adresses d'entrée, par exemple : address.
  2. Cliquez sur OK.
    Une colonne address est créée dans la table Inline Table
  3. Dans la table Inline Table, saisissez les données d'adresses que vous souhaitez analyser, par exemple :
    "1211 AVENUE OF AMERICAS FL 8 10036 NEW YORK USA"
    "B69 2lt 9kings   United Kingdom ave"
    "1729号 黄兴路 China, 200433"
    "15 Rue Nelaton   Paris PARIS 92800 France"
    "1211 AVENUE OF AMERICAS FL 8 10036 NEW YORK"
    
  4. Dans l'onglet Basic settings du tAddressRowCloud, sélectionnez MelissaData dans la liste Address Provider.
  5. Dans le champ License key/KPI key, saisissez la clé de licence fournie par MelissaData.
  6. Dans la table Mapping, cliquez sur le bouton [+] pour ajouter une ligne, puis sélectionnez Address.
    Le composant mappera les valeurs de ce champ vers la colonne d'entrée définie dans cette table.
  7. Si nécessaire, cochez la case Use Additional Output et utilisez la table Output Mapping pour récupérer les informations supplémentaires des adresses du référentiel de votre fournisseur.
    Pour plus d'informations, consultez Définir les champs d'adresses supplémentaires.
  8. Ne modifiez pas les paramètres dans la vue Advanced settings.
  9. Enregistrez votre Job et appuyez sur F6 pour l'exécuter.
    Le composant tAddressRowCloud transfère les données dans le Cloud, récupère les données corrigées et écrit le résultat dans le fichier de sortie.
  10. Cliquez-droit sur le composant de sortie et sélectionnez Data Viewer pour afficher les données des adresses formatées.
    Le tAddressRowCloud fait correspondre les données des adresses d'entrée aux données du référentiel MelissaData et écrit les adresses formatées dans le fichier de sortie.
    La colonne de sortie AddressVerificationCode retourne un code de vérification pour chacune des lignes d'adresse traitée. Ces codes sont écrits dans des listes délimitées par des virgules. Chaque code est composé de deux lettres suivies de deux chiffres. Ces codes indiquent différents statuts et erreurs. Par exemple, le code AC02 signifie que le nom d'état est corrigé selon la combinaison du nom de la ville et du code postal.
    Pour une liste complète de la signification des codes de résultat et pour plus d'informations concernant toutes les colonnes de sortie, consultez le Guide Address Object Reference Guide que vous pouvez télécharger depuis le Centre de Support de MelissaData sur http://www.melissadata.com/.
    La colonne de sortie VerificationLevel fournit un statut de vérification des adresses traitées. Pour plus d'informations, consultez Niveaux de vérification dans le tAddressRowCloud.