Écrire des tâches dans une campagne Merging - 7.1

Data Stewardship

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Stewardship
Gouvernance de données > Systèmes tiers > Composants Data Stewardship
Qualité et préparation de données > Systèmes tiers > Composants Data Stewardship
EnrichPlatform
Studio Talend
Talend Data Stewardship

Configurez le composant tDataStewardshipTaskOnput pour charger les groupes d'enregistrements similaires dans la campagne CRM Data Deduplication déjà définie dans Talend Data Stewardship. Cette campagne possède le même modèle de données que les données dans le fichier d'entrée.

Remarque : Lorsque vous chargez des tâches dans une campagne Merging, les enregistrements de données doivent être triés par identifiant de groupe afin que les enregistrements ayant la même colonne TDS_GID soient groupés dans la même tâche. Vous devez exécuter le Job une seule fois.

Procédure

  1. Double-cliquez sur le premier tDataStewardshipTaskOutput pour ouvrir sa vue Basic settings.
  2. Dans le champ URL, saisissez l'adresse de l'application avec le suffixe /data-stewardship/, par exemple http://company-mesos0:19999/data-stewardship/.

    Si vous travaillez avec Talend Cloud Data Stewardship, utilisez l'une des adresses suivantes pour accéder à l'application :

    • https://tds.us.cloud.talend.com/data-stewardship pour le centre de données des États-Unis.
    • https://tds.eu.cloud.talend.com/data-stewardship pour le centre de données de l'Europe.
    • https://tds.ap.cloud.talend.com/data-stewardship pour le centre de données de l'Asie-Pacifique.
  3. Saisissez vos informations d'authentification dans les champs Username et Password.
    Pour saisir votre mot de passe, cliquez sur le bouton […] à côté du champ Password, saisissez votre mot de passe entre guillemets doubles dans la boîte de dialogue qui s'ouvre, puis cliquez sur OK.
    Si vous utilisez Talend Cloud Data Stewardship et que :
    • Si l'authentification multifacteur (MFA) est activée, saisissez un jeton d'accès dans le champ.
    • Si l'authentification multifacteur (MFA) n'est pas activée mais que le SSO (Single Sign-On) est configuré, saisissez un jeton d'accès ou votre mot de passe dans le champ.

      Il est recommandé d'utiliser des jetons, car les mots de passe seront bientôt obsolètes et ne seront plus utilisés.

    • Si l'authentification multifacteur n'est pas activée et que le SSO n'est pas configuré, saisissez un jeton d'accès ou votre mot de passe dans le champ.
  4. Cliquez sur Find a campaign pour ouvrir une boîte de dialogue listant les campagnes définies dans Talend Data Stewardship, dont vous êtes le (la) propriétaire, ou sur lesquelles vous avez les droits d'accès.
  5. Cliquez sur la colonne d'en-tête pour trier la liste par ordre alphabétique pour les colonnes de texte et chronologiquement pour la colonne de date. Choisissez la campagne dans laquelle écrire les tâches arbitration, CRM Data Deduplication, et cliquez sur OK.

    Les champs Label et Type sont automatiquement renseignés avec les métadonnées de la campagne.

    Le modèle de données de la campagne sélectionnée est récupéré et est en lecture seule. Les colonnes suivantes sont ajoutées par défaut :
    • TDS_DUE_DATE fournit l'échéance de la tâche au format YYYY-MM-DD HH:mm:ss. L'échéance est automatiquement calculée selon le délai de résolution de la tâche, défini dans la campagne, s'il y en a un.
    • TDS_EXTERNAL_ID que vous pouvez utiliser pour fournir l'identifiant de la tâche définir dans le Job.
    • TDS_GID est utilisée pour grouper les enregistrements dans les tâches. Tous les enregistrements source devant être groupés dans une seule tâche doivent avoir la même colonne TDS_GID.
    • TDS_MASTER indique si l’enregistrement est un enregistrement maître ou source.

      Si aucune source n'est définie en tant que maître pour une tâche donnée, Talend Data Stewardship détermine initialement les attributs des enregistrements correspondants pour créer l'enregistrement maître, selon les règles de consolidation définies lors de la création de la campagne.

    Vous pouvez cliquer sur Edit Schema pour afficher le schéma, si nécessaire.

    Le schéma de sortie du tDataStewardshipTaskOutput utilise toujours le type String pour toutes les colonnes, indépendamment du type de données initial, sauf pour celles générées par défaut.

  6. Cochez la case Override enforcement of data model afin de charger les nouvelles tâches, même si leur type de schéma ne correspond pas à ce qui a été défini dans Talend Data Stewardship.
  7. Configurez les métadonnées des tâches que vous souhaitez écrire dans la campagne Merging, comme suit :
    • dans la liste State, choisissez d'écrire les tâches et de leur assigner un statut new.

    • Dans la liste Assignee, sélectionnez No Assignee pour écrire les tâches dans la campagne en attente d'assignation de participants de campagne.

    • Ne modifiez pas la valeur par défaut dans la liste Priority.

      Si aucun niveau de priorité n'a été choisi, Medium est utilisé par défaut.

  8. Dans le champ Tag, saisissez le ou les mot(s)-clé(s) que vous souhaitez associer aux tâches, utilisez une virgule pour séparer les mots-clés.
    Vous pouvez utiliser les mots-clés pour filtrer les tâches à charger dans la campagne.
  9. Dans la table Comments, saisissez un commentaire pour une ou plusieurs colonnes, si nécessaire.
  10. Cliquez sur Advanced settings pour ouvrir la vue correspondante et configurer le nombre de tâches que doit contenir chaque commit, dans le champ Max tasks per commit.
    Il n'y a pas de limite pour la taille des lots dans Talend Data Stewardship (version on-premises). Cependant, ne dépassez pas 200 tâches par commit dans Talend Cloud Data Stewardship, sinon le Job échoue.