Propriétés du tGoogleGeocoder - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Famille du composant

Data Quality/Address

 

Fonction

Le composant tGoogleGeocoder accède à l'API Google Places via une requête HTTP afin d'obtenir des coordonnées géographiques, selon les informations relatives à l'adresse que vous avez fournies.

Pour plus d'informations sur l'API Google Places, consultez Google Places API.

Chaque ligne de données a besoin d'un ou plusieurs appels vers l'API Places. Le quota dépend de la licence fournie par Google. Assurez-vous de ne pas exécuter le composant sur un ensemble de données excédant votre quota car vous aurez des messages d'erreur et les adresses ne seront pas corrigées.

Pour plus d'informations sur les limites d'utilisation de l'API Google Places, consultez Usage Limits and Billing.

Pour plus d'informations sur les conditions d'utilisation de l'API Google Places, consultez Terms of Service.

Objectif

Le tGoogleGeocoder vous permet de convertir des adresses d'un format lisible par l'homme en coordonnées géographiques et autres informations géographiques.

Basic settings

Pause(in 1/10 seconds)

Temps de pause entre les requêtes HTTP pour les enregistrements relatifs aux informations géographiques. Par défaut, la valeur de ce champ est 1.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

 

Address column

Dans cette liste, sélectionnez un paramètre à utiliser lors de l'envoi de la requête vers l'API Google Places. Les paramètres de la liste sont prédéfinis dans le schéma des données d'entrée.

 

API key

Saisissez votre clé API.

Vous devez générer la clé API depuis la console développeur de Google sur https://developers.google.com/console/help/new/.

Note

Les Jobs migrés depuis des versions antérieures à la version 5.6 du Studio ont besoin d'une clé pour fonctionner. Générez une clé et définissez-la dans la vue Basic settings du tGoogleGeocoder avant d'exécuter le Job.

Les informations géographiques obtenues depuis ces Jobs peuvent être différentes de celles obtenues auparavant avec l'API Google Geocoding.

  Sync columns Cliquez sur le bouton afin de récupérer le schéma du composant précédent dans le Job.

 Advanced settings

import

Personnalisez ce champ pour importer une classe Java pour le tGoogleGeocoder. Par défaut, vous n'avez pas à modifier cette partie.

  tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

  Enable parallel execution

Cocher cette case permet de traiter plusieurs flux de données simultanément. Cela permet de traiter les données plus rapidement. Notez que cette fonctionnalité dépend de la capacité de la base de données ou de l'application à gérer plusieurs insertions en parallèle ainsi que le nombre de processeurs utilisés. Dans le champ Number of parallel executions, vous pouvez :

  • Saisir le nombre d'exécutions parallèles désiré.

  • Appuyer sur Ctrl+Espace et sélectionner la variable de contexte dans la liste. Pour plus d'informations, consultez le Guide utilisateur du Studio Talend.

Notez que, lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour récupérer les valeurs de retour dans un sous-job.

Avertissement

  • Le champ Action on table n'est pas disponible avec la fonction de parallélisation. Ainsi, pour créer une table, vous devez utiliser un composant tCreateTable.

  • Lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-job.

Global Variables

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est un composant intermédiaire. Il nécessite un composant d'entrée, un composant de sortie et un lien Main Row.