Propriétés du tStewardshipTaskOutput - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Famille du composant

Talend MDM

 

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-in : Le schéma sera créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend .

 

Url

Saisissez l'URL pour accéder à l'application Talend Data Stewardship Console.

Pour plus d'informations concernant les paramètres de l'URL, consultez Configuration de l'URL pour accéder à Talend Data Stewardship Console.

 

Username et Password

Saisissez les informations d'authentification de l'utilisateur pour la base de données de la console d'arbitrage.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

 

Task name

Nommez la tâche que vous souhaitez lister dans Talend Data Stewardship Console.

 

Type

Si nécessaire, sélectionnez le type des tâches que vous souhaitez lire :

Resolution : les tâches de résolution de données représentent les résultats des processus de mise en correspondance des données effectués sur les données de différentes sources.

Data : les tâches d'intégrité de données sont les résultats des processus d'intégrité de données effectués sur les données.

Pour plus d'informations concernant les types de tâches et la gestion des tâches, consultez le Guide utilisateur de Talend Data Stewardship Console.

 

Created by

Saisissez le nom du créateur de la tâche.

Note

Les créateurs de tâches correspondent aux utilisateurs de Talend MDM Web User Interface. Pour plus d'informations, consultez le Guide utilisateur de Talend MDM Web User Interface.

 

Owner

Saisissez le nom du propriétaire de la tâche.

Note

Les propriétaires de tâches correspondent aux utilisateurs de Talend MDM Web User Interface. Pour plus d'informations, consultez le Guide utilisateur de Talend MDM Web User Interface.

 

Star

Saisissez le chiffre, entre 0 et 5, que vous souhaitez assigner aux tâches comme classement numérique, sous forme d'étoiles, mettant en valeur l'importance des tâches.

 

Tag

Saisissez le nom de la catégorie du tag que vous souhaitez associer aux tâches que vous voulez écrire.

Avertissement

Les catégories de tag doivent avoir été créées précédemment dans la console d'arbitrage. Pour plus d' informations concernant la création de catégories de tag, consultez le Guide utilisateur de Talend Data Stewardship Console.

Note

Tâches de résolution uniquement

Looping column

Sélectionnez une colonne dans le schéma d'entrée sur laquelle effectuer la boucle. Lorsque la valeur de la colonne sur laquelle est effectuée la boucle change, le composant ferme l'élément précédent (tâche) et en ouvre un nouveau (nouvelle tâche).

Note

La colonne sur laquelle est effectuée la boucle est généralement l'ID du groupe généré par le composant tMatchGroup. Pour plus d'informations, consultez tMatchGroup.

 

Source/Target selector

Sélectionnez une colonne dans le schéma d'entrée qui décidera si les enregistrements de tâches définis selon la colonne de boucle seront des enregistrements source ou cible.

 

Source

Sélectionnez une colonne dans le schéma d'entrée.

Note

Tâches de résolution uniquement

Score

Sélectionnez la colonne de score de correspondance dans le schéma d'entrée.

Note

Tâches de résolution uniquement

Weights

Sélectionnez la colonne définissant la distance de correspondance pour chaque colonne du schéma d'entrée.

 

Extra info

Si nécessaire, utilisez le bouton [+] pour ajouter une ou plusieurs ligne(s) pour toute information supplémentaire, que vous souhaitez ajouter à l'un des enregistrements source.

Dans la colonne Title, saisissez les informations clés.

Dans la colonne Message, saisissez les informations que vous souhaitez ajouter.

Dans la colonne Column, cliquez dans la ligne ajoutée et sélectionnez la colonne source à laquelle vous souhaitez ajouter l'information supplémentaire.

L'arbitre peut voir les informations ajoutées à chaque fois qu'il place sa souris sur la colonne d'enregistrement dans Talend Data Stewardship Console. Cette information lui permettra de prendre des décisions plus informées lors de la résolution de la tâche.

 

Record column

Utilisez le bouton [+] afin d'ajouter autant de lignes que nécessaire, puis cliquez dans chacune des lignes et sélectionnez les colonnes du schéma d'entrée qui formeront l'enregistrement cible.

 

Max tasks per commit

Saisissez le nombre maximal de tâches par commit.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant écrit des enregistrements des données contenus dans des tâches. Ce composant nécessite un flux d'entrée.

Si un Job contient de trop nombreuses tâches à gérer dans l'application Talend Data Stewardship Console, il est recommandé d'augmenter les valeurs des délais avant suspension, avant d'exécuter le Job.

Vous pouvez personnaliser les deux valeurs de délai avant suspension comme suit :

  • -Dtaskload_connect_timeout spécifie la valeur du délai avant suspension pour la connexion à l'application Talend Data Stewardship Console.

  • -Dtaskload_read_timeout spécifié la valeur du délai avant suspension pour lire dans l'application Talend Data Stewardship Console.

Par défaut, les valeurs sont 50 000 millisecondes.

Pour augmenter ces valeurs, procédez comme suit :

  1. Dans la vue Run, cliquez sur l'onglet Advanced settings.

  2. Dans la zone JVM Settings, cochez la case Use specific JVM arguments pour activer la table Argument.

  3. À côté de la table Argument, cliquez sur le bouton New... pour ouvrir la boîte de dialogue [Set the VM Argument].

  4. Dans la boîte de dialogue, saisissez la valeur du délai avant suspension, en millisecondes. Par exemple, -Dtaskload_connect_timeout=60000.

  5. Cliquez sur OK pour fermer la boîte de dialogue.

  6. Répétez les étapes ci-dessus pour paramétrer une autre valeur en millisecondes. Par exemple, -Dtaskload_read_timeout=60000.

    Pour plus d'informations concernant l'application d'un argument JVM pour toutes les exécutions de Jobs, consultez le Guide utilisateur du Studio Talend.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).