Récupérer des tâches depuis Talend Data Stewardship - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce Job lit les tâches stockées sur le serveur de Talend Data Stewardship selon les critères définis dans la vue Basic settings des composants tDataStewardshipTaskInput.

Pour plus d'informations concernant Talend Data Stewardship, consultez la documentation de Talend Data Stewardship sur Talend Help Center https://help.talend.com (en anglais).

Créer un Job récupérant les tâches d'arbitrage

Créez un Job pour vous connecter au serveur de Talend Data Stewardship, récupérer les tâches d'un certain nombre de campagnes et les lister dans la console de log du Studio. Vous pouvez utiliser ce Job avec n'importe quel composant de sortie Talend pour écrire les tâches récupérées dans une application ou un système cible.

Les trois campagnes utilisées dans cet exemple sont :

  • Une campagne Arbitration, Beta Candidates, qui stocke les tâches des candidats pour un programme de bêta test,

  • Une campagne Resolution, Product Catalog, qui stocke les tâches de données des produits d'entreprise,

  • Une campagne Merging, CRM Data Deduplication, qui stocke les tâches des données clients récupérées du système CRM d'entreprise.

Prérequis :

  • Les campagnes desquelles vous souhaitez supprimer les tâches doivent déjà être définies dans Talend Data Stewardship et contenir des tâches.

  • Vous devez avoir un rôle assigné de Campaign Owner, dans Talend Administration Center, vous permettant d'accéder aux campagnes du serveur.

  1. Dans l'espace de modélisation graphique, commencez à saisir tDataStewardshipTaskInput et sélectionnez ce composant dans la liste qui s'affiche. Répétez l'opération pour ajouter trois composants tDataStewardshipTaskInput dans l'espace de modélisation graphique.

  2. Répétez l'opération pour ajouter trois composants tLogRow dans l'espace de modélisation graphique.

  3. Reliez les composants tDataStewardshipTaskInput aux composants tLogRow à l'aide de liens Row > Main.

  4. Reliez les composants tDataStewardshipTaskInput à l'aide de liens Trigger > OnSubjobOk.

Récupérer les tâches des campagnes d'arbitrage

Configurez les trois composants tDataStewardshipTaskInput pour récupérer les tâches d'une campagne Arbitration, d'une campagne Resolution et d'une campagne Merging définies sur le serveur.

  1. Double-cliquez sur le premier composant tDataStewardshipTaskInput pour ouvrir sa vue Basic settings.

  2. Dans le champ URL, saisissez l'adresse du serveur de Talend Data Stewardship avec le suffixe /data-stewardship/, par exemple http://localhost:8990/data-stewardship/.

    Dans cet exemple, toutes les informations de connexion sont définies comme des paramètres de contexte et sont centralisées dans le référentiel du Studio. Pour plus d'informations concernant les paramètres de contexte, consultez le Guide utilisateur du Studio Talend.

  3. Saisissez vos informations de connexion au serveur, dans les champs Username et Password.

    Pour saisir votre mot de passe, cliquez sur le bouton [...] à côté du champ Password, saisissez votre mot de passe entre guillemets doubles dans la boîte de dialogue qui s'ouvre et cliquez sur OK.

  4. Cliquez sur Find a campaign pour ouvrir une boîte de dialogue listant les campagnes sur le serveur, dont vous êtes le propriétaire, ou sur lesquelles vous avez les droits d'accès.

  5. Cochez la case Override enforcement of data model pour lire les tâches même si leur type de schéma ne correspond pas à ce qui a été défini sur le serveur de Talend Data Stewardship.

  6. Cliquez sur un en-tête de colonne pour trier la liste par ordre alphabétique, pour les colonnes de texte et par ordre chronologique, pour les colonnes de dates. Sélectionnez la campagne de laquelle récupérer les tâches, Beta Candidates pour le premier composant, puis cliquez sur OK.

    Les champs Campaign, Label et Type sont automatiquement renseignés avec les métadonnées de la campagne.

    Le schéma de la campagne sélectionnée est récupéré du serveur et est en lecture seule. Vous pouvez cliquer sur Edit Schema afin de l'afficher. Des colonnes supplémentaires sont ajoutées au schéma pour donner les métadonnées de la tâche.

  7. Filtrez les tâches que vous souhaitez récupérer de la campagne Beta Candidates comme suit :

    • Dans la liste State, choisissez de récupérer les tâches résolues.

    • Dans la liste Assignee, sélectionnez Any Assignee pour récupérer les tâches par critères de recherche assignées à tout participant d'une campagne.

    • Dans la liste Priority, sélectionnez Any priority afin de récupérer les tâches de tous niveaux de priorité.

    • Dans la liste Choice, sélectionnez No afin de récupérer les tâches des candidats n'ayant pas été acceptés pour le programme de bêta-test.

  8. Dans le champ Tag, saisissez le ou les mot(s)-clé(s) que vous souhaitez associer aux tâches. Utilisez une virgule afin de séparer les différents mots-clés.

    Vous pouvez utiliser les mots-clés pour filtrer les tâches à récupérer.

  9. Dans le champ Query, saisissez l'instruction de requête que vous souhaitez utiliser pour affiner le filtre défini dans les propriétés du composant, si nécessaire.

  10. Cliquez sur Advanced settings pour ouvrir la vue correspondante et :

    • configurez les nombre de tâches que vous souhaitez avoir dans chaque lot, dans le champ Batch Size.

    • laissez cochée la case Consume tasks when they are read afin de récupérer les tâches une seule fois.

  11. Double-cliquez sur les deux autres composants tDataStewardshipTaskInput et suivez les mêmes étapes afin de décider quelles tâches récupérer des campagnes Product Catalog et CRM Data Deduplication.

    Avec la campagne de type Merging CRM Data Deduplication, la case Retrieve only golden record est cochée par défaut, car seuls les enregistrements maître vous intéressent.

Lister les tâches récupérées du serveur dans la console du Studio

Configurez les composants tLogRow pour afficher dans la console du Studio Talend les tâches récupérées des campagnes Arbitration, Resolution et Merging.

  1. Double-cliquez sur chaque composant tLogRow pour ouvrir sa vue Basic settings.

  2. Dans la zone Mode, sélectionnez Table (print values in cells of a table) pour une lisibilité optimale des résultats.

Exécuter le Job pour récupérer les tâches des campagnes d'arbitrage

Une fois le Job et ses composants configurés, vous pouvez exécuter le Job afin de récupérer les tâches d'arbitrage et vérifier les résultats d'exécution.

  • Appuyez sur F6 afin de sauvegarder et exécuter le Job.

    Les tâches des trois campagnes sont récupérées selon les critères de filtre et affichées dans la console du Studio.

    Vous pouvez utiliser les composants de sortie Talend pour remplacer les composants tLogRow utilisés dans ce Job, pour écrire les tâches récupérées dans des applications ou systèmes cible.