Propriétés du tDataStewardshipTaskInput standard - 7.0

Data Stewardship

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Stewardship
Gouvernance de données > Systèmes tiers > Composants Data Stewardship
Qualité et préparation de données > Systèmes tiers > Composants Data Stewardship
EnrichPlatform
Studio Talend
Talend Data Stewardship

Ces propriétés sont utilisées pour configurer le composant tDataStewardshipTaskInput lorsqu'il s'exécute dans un framework de Jobs standard.

Le composant tDataStewardshipTaskInput standard appartient à la famille Talend Data Stewardship.

Le composant de ce framework est disponible dans tous les produits Talend nécessitant une souscription.

Basic settings

Property Type

Peut-être Built-in ou Repository.

 

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Les colonnes ci-dessous sont automatiquement ajoutées à ce composant et sont en lecture seule. Elles donnent les métadonnées de la tâche.
  • TDS_ID  : identifiant de la tâche.

  • TDS_STATE : état courant de la tâche.

  • TDS_ASSIGNEE : personne à qui la tâche est assignée.

  • TDS_CREATION : date de création de la tâche.

  • TDS_LAST_UPDATE : date de dernière mise à jour de la tâche.

  • TDS_LAST_UPDATED_BY  : identifiant du dernier utilisateur ayant mis à jour la tâche.

  • TDS_PRIORITY : valeur numérique représentant le niveau de priorité de la tâche dans l'application Web. Chaque valeur numérique est récupérée à partir d'une valeur de texte, comme ci-dessous :

    • Very Low = 0

    • Low = 1

    • Medium = 2

    • High = 3

    • Very High = 3

    Le niveau No Priority est configuré par défaut à Medium = 2.

  • TDS_TAGS : mot(s)-clé(s) assignés à la tâche récupérés en liste de valeurs séparées par des virgules.

  • TDS_ARBITRATION : (disponible uniquement lorsque le type de campagne ARBITRATION est sélectionné) choix assigné à la tâche dans les valeurs de l'énumération.

  • TDS_ARBITRATION_LABEL : (disponible uniquement lorsque le type de campagne ARBITRATION ou GROUPING est sélectionné) choix assigné à la tâche comme affiché dans Talend Data Stewardship.

  • TDS_MASTER : (disponible uniquement lorsque le type de campagne MERGING est sélectionné) indique si l'enregistrement est un enregistrement maître.

  • TDS_SOURCE : (disponible uniquement lorsque le type de campagne MERGING est sélectionné) nom de la source de l'enregistrement.

  • TDS_SCORE : (disponible uniquement lorsque le type de campagne GROUPING ou MERGING est sélectionné) distance calculée entre l'entrée et l'enregistrement maître, selon l'algorithme de rapprochement.

  • TDS_EXTERNAL_ID : vous permet de définir un identifiant de votre choix sur des tâches, afin de les récupérer facilement à partir de tout autre système tel que Talend MDM Web UI.

URL

Saisissez l'adresse pour accéder au serveur de Talend Data Stewardship, avec le suffixe /data-stewardship/, par exemple http://<server_address>:19999/data-stewardship/.

Si vous travaillez avec Talend Cloud Data Stewardship, utilisez l'une des adresses suivantes pour accéder à l'application :

  • https://tds.us.cloud.talend.com/data-stewardship pour le centre de données des États-Unis.
  • https://tds.eu.cloud.talend.com/data-stewardship pour le centre de données de l'Europe.

Username et Password

Saisissez les informations d'authentification au serveur de Talend Data Stewardship.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Campaign

Cliquez sur Find a campaign pour ouvrir une liste de toutes les campagnes disponibles dans Talend Data Stewardship, et sélectionnez le nom de la campagne de laquelle supprimer les tâches. Il s'agit d'un champ informatif en lecture seule.

Type

Liste en lecture seule affichant le type de campagne parmi les types prédéfinis, une fois la campagne sélectionnée dans les paramètres simples.

Override enforcement of data model

Cochez cette case si vous souhaitez traiter les données sur le serveur de Talend Data Stewardship, même si le type de schéma est invalide. Aucune validation d'entrée du schéma n'est effectuée. Cette case est cochée par défaut pour les campagnes RESOLUTION. Cependant, cette case doit être cochée pour tous les types de campagnes, afin de garantir un traitement des données sans accroc.

State et Assignee

State : sélectionnez dans la liste l'état de la tâche que vous souhaitez supprimer.

Assignee : sélectionnez le participant de la campagne dont vous souhaitez supprimer les tâches. Sinon, sélectionnez No Assignee pour supprimer les tâches par critères de recherche, sans prendre en compte les personnes assignées.

Sinon, sélectionnez Custom et configurez une expression personnalisée dans le champ qui s'affiche.

Priority, Choice et Tags

Priority (facultatif) : sélectionnez l'une des priorités des tâches. Sinon, sélectionnez Custom et configurez une expression personnalisée dans le champ qui s'affiche.

Choice (facultatif, disponible uniquement lorsqu'une campagne ARBITRATION est sélectionnée) : sélectionnez l'une des options configurées sur les tâches de la campagne.

Tags (facultatif) : sélectionnez le ou les mots-clés assignés aux tâches. Vous pouvez utiliser les mots-clés pour filtrer les tâches à récupérer.

Query

Saisissez l'instruction de requête que vous souhaitez utiliser pour filtrer les tâches à traiter.

La condition se compose d'un nom de champ, d'un opérateur et d'une valeur. Lorsque vous référencez des données d'enregistrements, le nom du champ doit comporter le préfixe record.. Par exemple, pour filtrer les tâches par personne assignée et valeur du prénom, lorsque vous avez un champ FirstName dans l'enregistrement, utilisez assignee='user1@talend.com' dans le champ Assignee et 'De\'wayne' dans le champ Query.

Pour plus d'informations concernant le langage utilisé pour effectuer des requêtes et filtrer les données sur le serveur de Talend Data Stewardship, consultez Langage de requête utilisé avec les composants Talend Data Stewardship.

Retrieve golden record only

Cochez cette case pour lire uniquement les enregistrements maître résultant du processus de fusion.

Cette option est sélectionnée par défaut et est disponible uniquement avec les campagnes de type MERGING.

Advanced settings

Campaign ID

Il affiche le nom technique de la campagne une fois la campagne sélectionnée. Cependant, vous pouvez modifier la valeur du champ afin de la remplacer par un paramètre de contexte par exemple, et passer les variables de contexte à un Job au moment de l'exécution. Ce nom technique est toujours utilisé pour identifier une campagne lorsque le Job communique avec Talend Data Stewardship quelle que soit la valeur du champ Campaign.

Batch Size

Configurez le nombre de lignes que vous souhaitez dans chaque lot traité.

Ne modifiez pas la valeur par défaut, sauf si vous rencontrez des problèmes de performance. Augmenter la taille du lot peut améliorer les performances, mais une valeur trop haute peut causer des échecs du Job.

Consume tasks when they are read

Cette case est cochée par défaut pour marquer les tâches comme consommées sur le serveur de Talend Data Stewardship une fois récupérées par le composant. Ces tâches ne seront pas récupérées une seconde fois lorsque vous exécutez à nouveau le Job avec les mêmes critères de filtre.

Assurez-vous de décocher cette case uniquement pour les cas d'utilisation spécifiques, sinon vous risquez fortement de traiter deux fois les mêmes tâches.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

NB_LINE

Nombre de messages traités. Cette variable est une variable After et retourne un entier.

NB_REJECT

Nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

NB_SUCCESS

Nombre de lignes correctement traitées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE

Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé en tant que composant de début dans un Job ou un sous-Job et nécessite un lien de sortie.