tMDMInput - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tMDMInput

Famille du composant

Talend MDM

 

Fonction

Le composant tMDMInput lit les données maître du hub MDM.

Objectif

Ce composant lit les données maître dans un hub MDM et rend possible le traitement de ces données.

Basic settings

Property Type

Peut être Built-in ou Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier de propriétés du composant. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-in : Le schéma sera créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Voir également le Guide utilisateur du Studio Talend.

 Use an existing connectionCochez cette case et sélectionnez le composant tMDMConnection adéquat à partir de la liste Component pour réutiliser les paramètres d'une connexion que vous avez déjà définie.
 

MDM version

Par défaut, l'option Server 6.0 est sélectionnée. Bien qu'il soit recommandé de migrer les Jobs existants vers cette nouvelle version, l'option Server 5.6 est disponible pour faciliter le processus de migration de vos Jobs, afin qu'ils continuent à fonctionner avec un serveur 6.0 sans modification. Pour ce faire, une option sur le serveur doit être activée pour accepter et traduire les requêtes de ces Jobs.

 

URL

Saisissez l'URL d'accès au serveur MDM.

 

Username et Password

Saisissez les informations d'authentification de l'utilisateur du serveur MDM.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles, puis cliquez sur OK afin de sauvegarder les paramètres.

 

Entity

Saisissez le nom de l'entité contenant les données que vous souhaitez effacer.

 

Data Container

Saisissez le nom du conteneur de données contenant les données que vous souhaitez effacer.

Type

Sélectionnez Master ou Staging pour spécifier sur quelle base de données effectuer l'action.

 

Use multiple conditions

Cochez cette case pour filtrer les données maître à l'aide de conditions.

Xpath : saisissez, entre guillemets, le nœud XML sur lequel appliquer la condition.

Function : sélectionnez la condition à utiliser. Selon le type de champ vers lequel pointe le XPath, seuls certains opérateurs s'appliquent. Par exemple, si le champ est un booléen, seuls les opérateurs Equal et Not Equal s'appliquent.

Les opérateurs suivants sont disponibles :

  • Contains : Retourne un résultat contenant le ou les mot(s) saisi(s).

  • Joins With : Cet opérateur est réservé pour un usage ultérieur.

  • Starts With : Retourne un résultat commençant par la chaîne de caractères saisie.

  • Strict Contains : Retourne un résultat contenant l'expression régulière exacte saisie. S'applique uniquement aux bases de données XML.

  • Equal : Retourne un résultat correspondant au booléen saisi, True ou False.

  • Not Equal : Retourne un résultat dont la valeur est différente du booléen saisi, True ou False.

  • is greater than : Retourne un résultat supérieur à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.

  • is greater or equal : Retourne un résultat supérieur ou égal à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.

  • is lower than : Retourne un résultat inférieur à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.

  • is lower or equal : Retourne un résultat inférieur ou égal à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.

  • whole content contains : Effectue une recherche plein texte dans tous les champs de l'entité. Pour les bases de données SQL, une recherche "Starts with" est effectuée. Pour les bases de données XML, une recherche "Contains" est effectuée.

  • contains a word like : Effectue une recherche floue afin de retourner un mot similaire au mot saisi.

  • is empty or null : Retourne un résultat dans lequel le champ est vide ou retourne une valeur nulle.

Value : saisissez, entre guillemets, la valeur souhaitée. Notez que si la valeur contient des caractères XML spéciaux, comme /, vous devez saisir la valeur entre guillemets simples également ("'ABC/XYZ'"), sinon la valeur est considérée comme XPath.

Predicate : sélectionnez un prédicat lorsque vous utilisez plusieurs conditions.

Les prédicats suivants sont disponibles :

  • Default : Interprété comme un and.

  • or : L'une des conditions s'applique.

  • and : Toutes les conditions s'appliquent.

Les autres prédicats sont réservés pour usage ultérieur et peuvent être sujets à des comportements inattendus.

Si vous décochez cette case, vous avez la possibilité de sélectionner des ID particuliers devant être affichés dans la colonne ID value du tableau IDS.

Note

Si vous décochez la case Use multiple conditions, l'option Batch Size de l'onglet Advanced settings ne sera plus disponible.

 

Skip Rows

Renseignez le nombre de lignes à ignorer.

 

Max Rows

Nombre maximum de lignes à traiter. Si Limit = 0, aucune ligne n'est lue ou traitée.

 

Die on error

Cochez cette case pour passer la ligne en erreur et terminer le processus afin d'obtenir des lignes ne contenant aucune erreur. Si nécessaire, vous pouvez récupérer les lignes en erreur en utilisant un lien de type Row > Rejects.

Advanced settings

Batch Size

Nombre de lignes dans chaque lot traité.

Note

Cette option n'apparaît pas si vous avez décoché la case Use multiple conditions dans l'onglet Basic settings.

 

Loop XPath query

Nœud de l'arborescence XML sur lequel est basée la boucle.

 

Mapping

Column : reflète le schéma tel qu'il est défini dans l'éditeur Edit Schema.

XPath query : Saisissez les champs à extraire de la structure XML d'entrée.

Get Nodes : Cochez cette case pour récupérer les balises XML entourant les données avec celles-ci.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est utilisé comme composant de début. Il nécessite un flux de sortie.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Scénario : Lire les données maître d'un hub MDM

Ce scénario décrit un Job à deux composants qui lit les données maître dans un serveur MDM et les affiche dans la console de log.

  • A partir de la Palette, glissez les composants tMDMInput de la famille Talend MDM et tLogRow de la famille Logs & Errors dans l'espace de modélisation.

  • Reliez-les via un lien de type Row Main.

  • Double-cliquez sur le composant tMDMInput pour afficher l'onglet Basic settings de la vue Component et paramétrer ses propriétés.

  • Dans la liste Property Type, sélectionnez Built-In et renseignez les champs manuellement. Si vous avez stocké les informations de connexion au MDM dans les métadonnées du Repository, sélectionnez Repository dans la liste et les champs suivants seront renseignés automatiquement.

  • Dans la liste Schema, sélectionnez Built-In et cliquez sur le bouton [...] à côté du champ Edit schema pour décrire la structure des données maître que vous souhaitez lire sur le serveur MDM.

  • Les données maître sont récupérées dans un schéma à trois colonnes de type String : ISO2Code, Name, Currency. Cliquez sur OK.

  • Dans le champ URL, saisissez entre guillemets l'URL de connexion au serveur MDM.

  • Dans les champs Username et Password, saisissez l'identifiant et le mot de passe de connexion au serveur MDM.

  • Dans le champ Entity, saisissez entre guillemets le nom de l'entité métier contenant les données maître que vous souhaitez lire.

  • Dans le champ Data Container, saisissez entre guillemets le nom du conteneur de données contenant les données maître que vous souhaitez lire.

  • Dans la vue Component, cliquez sur l'onglet Advanced settings pour paramétrer les propriétés avancées du composant.

  • Dans le champ Loop XPath query, saisissez entre guillemets l'arborescence et le nom du nœud XML sur lequel effectuer la boucle.

  • Dans le tableau Mapping, les colonnes du schéma du composant apparaissent sous la colonne Column. Saisissez entre guillemets le nom de la balise XML dans laquelle récupérer les données maître dans le champ XPath query correspondant à la colonne du schéma de sortie.

  • Dans l'espace de modélisation, double-cliquez sur le composant tLogRow pour afficher l'onglet Basic settings de la vue Component et paramétrer ses propriétés.

  • Cliquez sur Edit schema et assurez-vous que le schéma est récupéré du composant précédent. Sinon, cliquez sur Sync Columns pour récupérer le schéma du composant.

  • Enregistrez votre Job et appuyez sur F6 pour l'exécuter.

La liste des différents pays, ainsi que leur code et devise est retournée dans la console de la vue Run.