Parser des adresses par rapport aux données de Google

Address standardization

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
Talend MDM Platform
Talend Data Fabric
Talend Data Services Platform
Talend Big Data Platform
Talend Data Management Platform
task
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation d'adresses
EnrichPlatform
Studio Talend

Vous pouvez exécuter le Job de Scénario : Parser les adresses par rapport aux données de référence dans le Cloud par rapport aux données de l'API Google Places en procédant de la manière suivante :

  1. Dans la vue Basic settings du tFixedFlowInput, créez le schéma en cliquant sur le bouton Edit Schema.
    Dans la boîte de dialogue qui s'ouvre, cliquez sur le bouton [+] et ajoutez une colonne qui contiendra les informations dans les données d'adresses, dans cet exemple : address.
  2. Cliquez sur OK.
    Une colonne address est créée dans la table Inline Table.
  3. Dans la table Inline Table, saisissez les données d'adresses que vous souhaitez analyser, par exemple :
    "1211 AVENUE OF AMERICAS FL 8 10036 NEW YORK USA"
    "B69 2lt 9kings   United Kingdom ave"
    "1729号 黄兴路 China, 200433"
    "15 Rue Nelaton   Paris PARIS 92800 France"
    "1211 AVENUE OF AMERICAS FL 8 10036 NEW YORK"
    "1 Rue de l'Abbaye, Paris"
    "1 Chemin de l'Abbaye, Paris"
    "1 Place de l'Abbaye basset, Paris"
    "8000 Cummings Hall,Hanover,New Hampshire,03755,"
    
  4. Dans la vue Basic settings du tAddressRowCloud, sélectionnez Google dans la liste Address Provider.
  5. Dans le champ License/API key, saisissez la clé de l'API générée depuis la console Google Developer Console à l'adresse suivante https://developers.google.com/console/help/new/.
  6. Dans la table Mapping, cliquez sur le bouton [+] pour ajouter une ligne, puis sélectionnez Address.
    Address est le seul champ disponible lorsque Google est le fournisseur d'adresses. Le composant mappera les valeurs de ce champ vers la colonne d'entrée définie dans cette table.
  7. Si nécessaire, cochez la case Use Additional Output et utilisez la table Output Mapping pour récupérer les informations supplémentaires des adresses du référentiel de votre fournisseur.
    Pour plus d'informations, consultez Définir les champs d'adresses supplémentaires.
  8. Dans la vue Advanced settings, définissez Output Script en FRENCH et laissez les autres paramètres inchangés.
  9. Enregistrez votre Job et appuyez sur F6 pour l'exécuter.
    Le composant tAddressRowCloud transfère les données dans le Cloud, récupère les données corrigées et écrit le résultat dans le fichier de sortie.
  10. Cliquez-droit sur le composant de sortie et sélectionnez Data Viewer pour afficher les données des adresses formatées.
    Le tAddressRowCloud fait correspondre les données des adresses d'entrée aux données de l'API Google Places et écrit les adresses formatées dans le fichier de sortie.
    La colonne de sortie VerificationLevel fournit un statut de vérification des adresses traitées. Pour plus d'informations, consultez Niveaux de vérification dans le tAddressRowCloud.