Scénario 1: Écrire des tâches dans des campagnes Arbitration et Resolution - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce Job charge des tâches dans deux campagnes différentes définies sur le serveur de Talend Data Stewardship selon les critères définis dans la vue Basic settings des composants tDataStewardshipTaskOutput.

Les enregistrements de données dans ces tâches contiennent des problèmes. Une fois sur le serveur, un participant de campagne autorisé peut intervenir et résoudre les tâches.

Pour plus d'informations concernant Talend Data Stewardship, consultez la documentation de Talend Data Stewardship sur Talend Help Center https://help.talend.com (en anglais).

Créer un Job pour écrire des tâches d'arbitrage sur le serveur

Créez un Job se connectant au serveur de Talend Data Stewardship et écrivant des enregistrements de données sous forme de tâches dans différentes campagnes.

Prérequis :

  • Les campagnes dans lesquelles vous souhaitez écrire les tâches, ainsi que leur schéma, doivent déjà être définis sur le serveur de Talend Data Stewardship.

  • Les tâches que vous souhaitez écrire doivent avoir le même schéma défini dans les campagnes.

  • Vous devez avoir un rôle de Campaign Owner assigné dans Talend Administration Center vous permettant d'accéder aux campagnes sur le serveur.

  1. Dans l'espace de modélisation graphique, commencez à saisir tDataStewardshipTaskOutput et sélectionnez ce composant dans la liste qui s'affiche. Répétez l'opération pour ajouter un autre composant tDataStewardshipTaskOutput dans l'espace de modélisation graphique.

  2. Répétez l'opération pour ajouter deux composants tFileInputDelimited dans l'espace de modélisation graphique.

  3. Reliez les composants tFileInputDelimited aux tDataStewardshipTaskOutput à l'aide de liens Row > Main.

  4. Reliez les tDataStewardshipTaskOutput à l'aide d'un lien Trigger > OnSubjobOk.

Lire des tâches et envoyer les champs au composant suivant

Configurez les tFileInputDelimited pour lire les tâches des fichiers d'entrée :

  • le premier contient les enregistrements des candidats d'un programme de bêta-test, à écrire dans une campagne Arbitration, nommée Beta Candidates,

  • le deuxième contient les enregistrements d'une gamme de produits d'une entreprise à écrire dans une campagne Resolution, nommée Product Catalog,

  1. Double-cliquez sur chaque composant tFileInputDelimited pour ouvrir sa vue Basic settings.

  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir une boîte de dialogue dans laquelle définir le schéma correspondant à la structure du fichier d'entrée.

    Ajoutez les groupes de colonnes ci-dessous dans les composants tFileInputDelimited :

    • tâches d'arbitrage : Id, First_name, Last_name, Gender, Age, Occupation, Company, Address, City, State, Zip, Phone et Email.

    • tâches de résolution : Id, Name, Material, Size, Price, Quantity, Family et Packaging.

  3. Cliquez sur OK dans chacune des boîtes de dialogue et acceptez la propagation des modifications.

    Chaque tDataStewardshipTaskOutput du Job hérite du schéma du composant tFileInputDelimited correspondant.

  4. Configurez les séparateurs de lignes et de champs dans les champs correspondants, ainsi que le nombre de lignes d'en-tête et de pied de page, s'il y en a.

Écrire des tâches dans les campagnes d'arbitrage

Configurez le composant tDataStewardshipTaskOnput pour charger les tâches dans une campagne Beta Candidates et une campagne Product Catalog, déjà définies sur le serveur de Talend Data Stewardship et ayant le même schéma que les données dans les fichiers d'entrée.

  1. Double-cliquez sur le premier tDataStewardshipTaskOutput pour ouvrir sa vue Basic settings.

  2. Dans le champ URL, saisissez l'adresse du serveur de Talend Data Stewardship avec le suffixe /data-stewardship/, par exemple http://localhost:8990/data-stewardship/.

    Dans cet exemple, toutes les informations de connexion sont définies comme des paramètres de contexte et sont centralisées dans le référentiel du Studio. Pour plus d'informations concernant les paramètres de contexte, consultez le Guide utilisateur du Studio Talend.

  3. Saisissez vos informations d'authentification au serveur dans les champs Username et Password.

    Pour saisir votre mot de passe, cliquez sur le bouton [...] à côté du champ Password, saisissez votre mot de passe entre guillemets doubles dans la boîte de dialogue qui s'ouvre et cliquez sur OK.

  4. Cliquez sur Find a campaign pour ouvrir une boîte de dialogue listant les campagnes sur le serveur, dont vous êtes le propriétaire, ou sur lesquelles vous avez les droits d'accès.

  5. Cliquez sur la colonne d'en-tête pour trier la liste par ordre alphabétique pour les colonnes de texte et chronologiquement pour la colonne de date. Sélectionnez la campagne dans laquelle écrire les tâches d'arbitrage, Beta Candidates pour le premier composant, puis cliquez sur OK.

    Les champs Campaign, Label et Type sont automatiquement renseignés avec les métadonnées de la campagne.

    Le schéma de la campagne sélectionnée est récupéré depuis le serveur et est en lecture seule. Vous pouvez cliquer sur Edit Schema afin de l'afficher.

  6. Cochez la case Override enforcement of data model pour charger les nouvelles tâches dans la campagne, même si leur type de schéma ne correspond pas à ce qui a été défini sur le serveur de Talend Data Stewardship.

  7. Configurez les métadonnées des tâches que vous souhaitez écrire dans la campagne Arbitration, comme suit :

    • dans la liste State, choisissez d'écrire les tâches et de leur assigner un statut new.

    • dans la liste Assignee, sélectionnez le participant de la campagne auquel vous souhaitez assigner les nouvelles tâches dans cet exemple. Sinon, sélectionnez No Assignee pour écrire dans la campagne les tâches en attente d'assignation d'un participant.

    • dans la liste Priority, sélectionnez High comme niveau de priorité à assigner aux tâches.

    • dans la liste Choice, sélectionnez No Choice pour écrire les tâches en attente d'un choix.

      Les arbitres de données doivent sélectionner le choix pertinent depuis l'application Web.

  8. Dans le champ Tag, saisissez le ou les mot(s)-clé(s) que vous souhaitez associer aux tâches, utilisez une virgule pour séparer les mots-clés.

    Vous pouvez utiliser les mots-clés pour filtrer les tâches à charger dans la campagne.

  9. Ajoutez des colonnes à la table Comments et saisissez un commentaire pour les colonnes Company et Occupation.

    Le participant de campagne peut voir les informations ajoutées à chaque fois qu'il place son curseur sur la colonne dans Talend Data Stewardship. Cette information lui permet de prendre des décisions plus informées lors de la résolution de la tâche.

  10. Cliquez sur Advanced settings pour ouvrir la vue correspondante et configurer le nombre de tâches que doit contenir chaque commit, dans le champ Max tasks per commit.

  11. Double-cliquez sur l'autre composant tDataStewardshipTaskOutput et suivez les mêmes étapes afin de décider des métadonnées des tâches à écrire dans la campagne Resolution.

    Ce Job écrit les tâches de résolution dans la campagne Product Catalog, ne les assigne à aucun participant et ne leur définit pas de niveau de priorité ou de mot-clé.

Exécuter le Job pour écrire des tâches dans les campagnes d'arbitrage

Une fois le Job et ses composants configurés, vous pouvez exécuter le Job pour écrire les tâches dans les campagnes définies sur le serveur de Talend Data Stewardship et vérifier les résultats d'exécution.

  • Appuyez sur F6 afin de sauvegarder et exécuter le Job.

    Les enregistrements de données des fichiers d'entrée sont écrits sous forme de tâche dans les campagne sélectionnées sur le serveur.

    Les tâches d'arbitrage sont déjà assignées à un arbitre de données spécifique comme défini dans les propriétés du composant, tandis que les tâches de résolution sont en attente d'assignation.

    Les arbitres de données autorisés peuvent accéder à ces campagnes et résoudre les tâches listées.

    Pour plus d'informations concernant Talend Data Stewardship, consultez la documentation de Talend Data Stewardship sur Talend Help Center https://help.talend.com (en anglais).