Propriétés du tMDMRestInput - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Famille du composant

Talend MDM

 

 Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-in : Le schéma sera créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Voir également le Guide utilisateur du Studio Talend.

 

Use an existing connection

Cochez cette case pour utiliser un composant tMDMConnection déjà configuré.

 

URL

Saisissez l'URL pour accéder au serveur MDM via l'API REST.

 

Username et Password

Saisissez les informations d'authentification au serveur MDM.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

 

Data Container

Saisissez le nom du conteneur de données contenant les enregistrements de données à lire.

Type

Sélectionnez Master ou Staging afin de spécifier le type de la base de données dans laquelle effectuer l'action.

 

Retrieve raw data

Cochez cette case pour récupérer tous les éléments d'une entité dans un seul champ, si nécessaire.

  • XML field : sélectionnez le nom du champ dans lequel écrire les données récupérées.

  • Accept Type : sélectionnez le type de contenu (XML ou JSON) que vous souhaitez récupérer.

 

Query Text

Saisissez la requête que vous souhaitez inclure dans les appels de l'API REST pour récupérer les enregistrements de données qui vous intéressent. Notez que cette étape est obligatoire.

Hormis la requête d'exemple par défaut, la requête peut être :

  • une variable globalMap, par exemple, ((String)globalMap.get("row1.query"))

  • une variable de contexte avec pré-échappement, par exemple, context.lpcMDMRestQuery

  • une requête incluant la variable globalMap et/ou la variable de contexte, par exemple, "{'select':{'from':['"+context.myEntity +"'],'fields':[{'field':'"+ (String)globalMap.get("field") +"'}] }}"

Une fois la requête saisie, assurez-vous que le schéma est bien défini par rapport à la requête. Pour plus d'informations, consultez Configuration du schéma à partir de la requête lors de l'utilisation d'un tMDMRestInput.

Avertissement

Vous devez cocher la case Retrieve Raw Data uniquement si vous souhaitez parser vous-même les données brutes de la requête, au format XML ou JSON.

 

Die on error

Cochez cette case pour passer les lignes en erreur et terminer le processus afin d'obtenir des lignes ne contenant aucune erreur. Si nécessaire, vous pouvez récupérer les lignes en erreur en utilisant un lien de type Row > Rejects.

Advanced settings

Batch Size

Nombre de lignes dans chaque lot traité.

Lorsque le nombre d'enregistrements de la requête est supérieur à la taille du lot, les enregistrements doivent être paginés et récupérés lot par lot.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job ainsi qu'au niveau des composants.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Le tMDMRestInput peut être utilisé avec les composants tMDMConnection, tMDMCommit et tMDMRollback.

Le tMDMRestInput nécessite un lien de sortie.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Configuration du schéma à partir de la requête lors de l'utilisation d'un tMDMRestInput

Lorsque vous utilisez le composant tMDMRestInput, vous pouvez utiliser le langage de la requête afin de réduire le nombre d'enregistrements de données à récupérer. Pour plus d'informations, consultez Talend Help Center (https://help.talend.com).

À partir de la requête, vous devez configurer correctement le schéma pour les données récupérées.

Faites attention aux cas suivants :

  • Lorsqu'une requête compte uniquement le nombre de résultats retournés par la requête, vous devez définir une seule colonne count dans le schéma.

  • Lorsqu'une requête récupère un champ de métadonnée, vous devez définir une colonne du même nom que le champ de métadonnée dans le schéma.

  • Lorsqu'une requête récupère un champ ou plusieurs champs, vous devez définir dans le schéma une ou plusieurs colonnes dont les noms sont les mêmes que les champs retournés.

  • Lorsqu'une requête utilise un alias, vous devez définir dans le schéma une colonne du même nom que le champ d'alias.

Par exemple, si une requête récupère les champs suivants, vous devez définir les colonnes dans le schéma en fonction : id, price, timestamp, taskid et productname.

 "{
  'select': {
        'from': ['Product'],
        'fields': [
               {'field': 'Product/Id'},
               {'field': 'Product/Price'},
               {'metadata': 'timestamp'},
               {'metadata': 'task_id'},
               {'alias' : [{'name' : 'ProductName'}, {'field': 'Product/Name'}]}
                  ]
             }
}"