tStewardshipTaskInput - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Avertissement

Ce composant est disponible dans la Palette du perspective soapUI mais vous pouvez l'utiliser uniquement si vous avez souscrit au produit Talend Platform correspondant.

Fonction

Le composant tStewardshipTaskInput lit des ensembles de données maître stockés dans la base de données de la console d'arbitrage sous forme de tâches. Ce composant peut récupérer des tâches selon certains critères de recherche ou sans critère de recherche, à condition que le schéma de sortie soit le même pour toutes les tâches récupérées.

Note

Afin de mieux comprendre l'objectif de ce composant, consultez le Guide utilisateur de Talend Data Stewardship Console.

Objectif

Ce composant lit des données maître dans la console d'arbitrage et permet le traitement de ces données, c'est-à-dire d'utiliser tout composant Talend de sortie et d'écrire les données récupérées à partir de la base de données d'arbitrage dans l'application cible ou dans la base de données.

Propriétés du tStewardshipTaskInput

Famille du composant

Talend MDM

 

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-in : Le schéma sera créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

 

Url

Saisissez l'URL pour accéder à l'application Talend Data Stewardship Console.

Pour plus d'informations concernant les paramètres de l'URL, consultez Configuration de l'URL pour accéder à Talend Data Stewardship Console.

 

Username et Password

Saisissez les informations d'authentification de l'utilisateur pour la base de données de la console d'arbitrage.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

 

Type

Si nécessaire, sélectionnez le type des tâches que vous souhaitez lire :

Resolution : les tâches de résolution de données représentent les résultats des processus de mise en correspondance des données effectués sur les données de différentes sources.

Data : les tâches d'intégrité de données sont le résultat des processus d'intégrité de données effectués sur les données.

Pour plus d'informations concernant les types de tâches et la gestion des tâches, consultez le Guide utilisateur de Talend Data Stewardship Console.

 

Owner

Au besoin, saisissez le nom du propriétaire de la tâche. Cela filtrera les tâches à lire par nom de propriétaires.

 

Tag

Si nécessaire, saisissez le nom de la catégorie du tag associé aux tâches que vous souhaitez lire.

Pour plus d'informations, consultez le Guide utilisateur de Talend Data Stewardship Console.

 

Start Date/End Date

Au besoin, saisissez une plage de dates de création de tâches dans laquelle vous pourrez lire les tâches comprises das cet intervalle. Suivez le format suivant : yyyy-mm-dd hh:mm:ss.

 

Status

Au besoin, sélectionnez dans la liste le statut de la tâche selon lequel vous souhaitez filtrer les tâches récupérées.

 

Star ranking

Au besoin, sélectionnez le nombre d'étoiles, de 0 à 5, affectée(s) aux tâches, comme un classement numérique mettant en valeur l'importance des tâches. Ce classement permet de filtrer les tâches selon leur importance.

 

Limit

Au besoin, saisissez le nombre maximum de tâches à récupérer. Si Limit = 0, aucune tâche n'est lue.

 

Target record only

Cette case est cochée par défaut.

Lorsque cette case est cochée, le composant récupère uniquement l'enregistrement cible de la tâche. Lorsque la case est décochée, le composant récupère l'(les) enregistrement(s) source en plus de l'enregistrement cible dans la tâche.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est un composant d'entrée. Il nécessite un flux de sortie.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Scénario : Lire des données dans la base de données de la console d'arbitrage

Ce scénario décrit un Job a deux composants qui lit des ensembles de données (enregistrements de données) à partir des tâches stockées dans la base de données de Talend Data Stewardship Console, selon les critères que vous avez définis dans la vue Basic settings du composant tStewardshipTaskInput.

Vous pouvez utiliser n'importe quel composant Talend de sortie pour écrire les données récupérées de la base de données d'arbitrage dans l'application ou la base de données.

Dans ce scénario, les données maître filtrées sont récupérées et affichées dans la console de log.

  • Déposez les composants tStewardshipTaskInput et tLogRow de la Palette dans l'espace de modélisation graphique.

  • Connectez les deux composants à l'aide d'un lien Row > Main.

  • Double-cliquez sur le tStewardshipTaskInput afin d'ouvrir sa vue Basic settings et définir ses propriétés.

  • Dans la liste Schema, sélectionnez Built-In et cliquez sur le bouton [...] à côté du champ Edit schema afin d'ouvrir une boîte de dialogue.

    Vous pouvez définir la structure des données que vous souhaitez lire dans la base de données de Talend Data Stewardship Console.

Note

Les colonnes par défaut dans la boîte de dialogue du schéma varient selon si la case Target record only est cochée ou non.

Si la case Target record only est cochée, le schéma par défaut ressemble à :

Si la case Target record only n'est pas cochée, le schéma par défaut contient deux colonnes supplémentaires : TARGET et SOURCE.

La colonne TARGET indique quel ensemble de données est l'enregistrement cible dans chacune des tâches de la base de données. La colonne SOURCE indique le nom de l'application source pour chaque enregistrement source dans les tâches.

Dans ce scénario, les données sont collectées depuis les trois colonnes d'entrée définies : Firstname, Lastname et DOB (prénom, nom et date de naissance), ainsi que des colonnes par défaut.

  • Cliquez sur OK pour fermer la boîte de dialogue et passer à l'étape suivante.

  • Dans le champ Url, saisissez l'URL de connexion à la base de données de la console d'arbitrage.

  • Dans les champs Username et Password, saisissez votre identifiant et votre mot de passe de connexion au serveur MDM.

  • Dans la liste Type, sélectionnez le type de tâches desquelles vous souhaitez récupérer les enregistrements de données : Resolution ou Data. Dans cet exemple, seules les tâches de résolution sont récupérées.

    Pour plus d'informations concernant les types de tâches, consultez le Guide utilisateur de Talend Data Stewardship Console.

  • Dans le champ Owner, saisissez entre guillemets le nom du propriétaire de la tâche, c'est-à-dire l'utilisateur auquel est assignée la tâche, Administrator dans cet exemple.

Note

Une tâche peut être assignée à un utilisateur spécifique soit à partir de la vue Basic settings du composant tStewardshipTaskOutput, soit directement à partir de la console d'arbitrage par un administrateur. Pour plus d'informations, consultez tStewardshipTaskOutput ainsi que le Guide utilisateur de Talend Data Stewardship Console.

  • Dans le champ Tag, saisissez entre guillemets nom de la catégorie du tag associé aux tâches que vous souhaitez lire. Ce champ n'est pas utilisé dans ce scénario.

    Pour plus d'informations, consultez le Guide utilisateur de Talend Data Stewardship Console.

  • Dans les champs Start Date et End Date, saisissez entre guillemets une plage de dates de création de tâches durant laquelle vous souhaitez lire les tâches. Ce champ n'est pas utilisé dans ce scénario.

  • Dans la champ Status, sélectionnez le statut de la tâche selon lequel vous souhaitez filtrez les données récupérées. Dans ce scénario, seules les tâches résolues sont récupérées.

  • Dans le champ Star ranking, sélectionnez dans la liste le nombre d'étoiles, de 0 à 5, assigné aux tâches dans la console d'arbitrage. Cela permet de filtrer les tâches desquelles vous souhaitez récupérer les données selon leur nombre d'étoiles.

    Dans cet exemple, sélectionnez 2 dans la liste. Les données seront récupérées de toutes les tâches ayant deux étoiles ou plus.

Note

Si vous sélectionnez  All dans la liste, vous récupérerez les données de toutes les tâches, quel que soit leur nombre d'étoiles.

  • Dans le champ Limit, saisissez un nombre afin de limiter les tâches à récupérer dans la base de données d'arbitrage.

  • Laissez cochée la case Target record only afin de récupérer uniquement l'enregistrement cible à partir des tâches.

  • Dans l'espace de modélisation graphique, double-cliquez sur le composant tLogRow afin d'afficher sa vue Basic settings et définir ses propriétés.

  • Cliquez sur Edit Schema pour ouvrir la boîte de dialogue du schéma et vérifier que le schéma a bien été reçu du composant précédent. Si ce n'est pas le cas, cliquez sur Sync Columns.

  • Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Le composant tStewardshipTaskInput a récupéré de la base de données de la console d'arbitrage à la fois les enregistrements de données cible et source de toutes les tâches résolues ayant 0, 1 ou 2 étoile(s). Le schéma de sortie est le même pour tous les enregistrements récupérés.

  • Décochez la case Target record only afin de récupérer tous les enregistrements source et cible à partir des tâches.

    Vous allez récupérer plus d'une ligne pour chaque tâche.

  • Dans la vue Basic settings du composant tLogRow, cliquez sur le bouton Sync columns afin de synchroniser le schéma du lien d'entrée (qui possède à présent deux colonnes supplémentaires) et celui du tLogRow.

  • Sauvegardez le Job et appuyez sur F6 pour l'exécuter.

    Le composant tStewardshipTaskInput récupère les enregistrements cible et source de la base de données de la console d'arbitrage à partir de toutes les tâches résolues ayant 0, 1 ou 2 étoile(s).

La capture d'écran ci-dessus montre un exemple des données récupérées de l'une des tâches de la base de données de la console d'arbitrage. Trois lignes ont été écrites en sortie pour cette tâche : l'enregistrement cible, pour lequel TARGET = true et deux enregistrements d'entrée pour lesquels TARGET = false et SOURCE = CRM.