Propriétés du tDataprepRun Standard - 7.0

Data Preparation

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
Talend Data Preparation
task
Création et développement > Systèmes tiers > Composants Data Preparation
Gouvernance de données > Systèmes tiers > Composants Data Preparation
Qualité et préparation de données > Systèmes tiers > Composants Data Preparation

Ces propriétés sont utilisées pour configurer le tDataprepRun s'exécutant dans le framework de Jobs Standard.

Le composant tDataprepRun Standard appartient à la famille Talend Data Preparation.

Le composant de ce framework est disponible dans tous les produits Talend nécessitant une souscription.

Basic settings

URL

Saisissez, entre guillemets doubles, l'URL de l'application Web Talend Data Preparation.

Username

Saisissez, entre guillemets doubles, l'adresse e-mail que vous utilisez pour vous connecter à l'application Web Talend Data Preparation.

Password

Cliquez sur le bouton [...] et saisissez, entre guillemets doubles, votre mot de passe pour l'application Web Talend Data Preparation.

Lorsque vous utilisez les propriétés de sélection de préparation par défaut :

Preparation

Pour renseigner le champ Preparation, choisissez l'une des options suivantes :
  • Choose an existing preparation pour choisir parmi la liste des préparations déjà existantes dans Talend Data Preparation.

  • Or create a new one pour créer une nouvelle préparation à partir de vos données source.

Cliquez sur ce bouton afin de modifier dans Talend Data Preparation la préparation correspondant à l'identifiant défini dans Preparation.

Version

Si vous avez créé plusieurs versions de votre préparation, vous pouvez choisir laquelle utiliser dans le Job. Pour remplir le champ Version, cliquez sur Choose a Version et choisissez parmi les versions existantes, y compris la version actuelle de la préparation.

Schema et Edit Schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Fetch Schema

Cliquez sur ce bouton pour récupérer le schéma à partir de la préparation définie dans le champ Preparation.

Lorsque vous utilisez la sélection dynamique de préparation :

Dynamic preparation selection

Cliquez sur ce bouton pour récupérer dynamiquement le schéma de la préparation définie par la variable de contexte dans le champ Preparation path. Si la récupération du schéma est réussie, tout schéma précédemment configuré sera écrasé. Si la récupération échoue, alors le schéma actuel est conservé.

Preparation path

Cochez cette case pour définir le chemin d'une préparation ainsi que sa version en utilisant des variables de contexte. La préparation sera sélectionnée dynamiquement au moment de l’exécution du Job.

Preparation version

Utilisez une variable de contexte pour définir le chemin de la préparation. Les chemins avec ou sans le / en début de ligne sont supportés.

Schema et Edit Schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Fetch Schema

Advanced settings

Limit Preview

Saisissez le nombre de lignes dont vous souhaitez limiter la prévisualisation.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job au niveau du Job ainsi qu'au niveau de chaque composant.

Variables globales

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend .

Utilisation

Règle d'utilisation

Ce composant est un composant intermédiaire. Il requiert un flux d'entrée ainsi qu'un flux de sortie.

Limitations

  • Si le jeu de données a été mis à jour après que le composant tDataprepRun a été configuré, le schéma doit être à nouveau récupéré.

  • Si une variable de contexte a été utilisée dans l'URL du jeu de données, vous ne pourrez pas utiliser le bouton pour modifier la préparation directement dans Talend Data Preparation.