Propriétés du tDBOutput Standard - 6.5

DB Generic

EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Database > Composants DB Generic
Gouvernance de données > Systèmes tiers > Composants Database > Composants DB Generic
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants DB Generic

Ces propriétés sont utilisées pour configurer le tDBOutput s'exécutant dans le framework de Jobs Standard.

Le composant tDBOutput Standard appartient à la famille Databases.

Le composant de ce framework est disponible dans tous les produits Talend.

Basic settings

Property type

Peut-être Built-In ou Repository.

 

Built-In : propriétés utilisées ponctuellement sans stockage dans le référentiel.

 

Repository : sélectionnez le référentiel dans lequel sont stockées les propriétés. Les champs suivants sont automatiquement renseignés à l'aide des données récupérées.

Cliquez sur cette icône pour ouvrir l'assistant de connexion à la base de données et stocker les paramètres de connexion configurés dans la vue Basic settings du composant.

Pour plus d'informations concernant la configuration et le stockage des paramètres de connexion à la base de données, consultez le Guide d'utilisation du Studio Talend .

Base de données

Nom de la source de données définie dans l'assistant de configuration de la connexion à la base de données.

Username et Password

Données d'authentification de l’utilisateur ou l'utilisatrice de la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Table

Nom de la table à écrire. Notez qu'une seule table peut être écrite à la fois.

Action on data

Sélectionnez l'opération que vous voulez effectuer :

Insert : ajoute de nouvelles entrées à la table. Le Job s'arrête lorsque des doublons sont trouvés.

Update : met à jour les entrées existantes.

Insert or update : insère un nouvel enregistrement. Si l'enregistrement avec la référence donnée existe déjà, une mise à jour est effectuée.

Update or insert : met à jour l'enregistrement avec la référence donnée. Si l'enregistrement n'existe pas, un nouvel enregistrement est inséré.

Delete : supprime les entrées correspondant au flux d'entrée.

Avertissement :

Il est nécessaire de spécifier au moins une colonne comme clé primaire sur laquelle baser les opérations Update et Delete. Pour ce faire, cliquez sur Edit Schema et cochez les cases à côté des colonnes que vous souhaitez définir comme clés primaires. Pour une utilisation avancée, cliquez sur l'onglet Advanced settings, vue dans laquelle vous pouvez définir simultanément des clés primaires pour les opérations Update et Delete. Pour ce faire, cochez la case Use field options et, dans la colonne Key in update, cochez les cases à côté des colonnes à utiliser comme base pour l'opération Update. Répétez l'opération dans la colonne Key in delete pour l'opération de suppression Delete.

Clear data in table

Cochez cette case pour que les données soient supprimées de la table sélectionnée avant toute action.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) dans le Repository. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

 

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Job Designs et projets.

Lorsque le schéma à réutiliser contient des valeurs par défaut de type Integer ou Function, assurez-vous que ces valeurs par défaut ne sont pas entourées de guillemets. Si elles le sont, supprimez manuellement les guillemets.

Pour plus d'informations, consultez la description relative à la récupération des schémas de tables dans le Guide utilisateur du Studio Talend.

 

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Die on error

Cette case est cochée par défaut. Décochez-la pour ignorer les lignes en erreur et terminer le processus avec les lignes sans erreur. Si nécessaire, vous pouvez récupérer les lignes en erreur en utilisant un lien de type Row > Rejects.

Advanced settings

Additional JDBC Parameters

Définissez des propriétés de connexion supplémentaires pour la connexion à la base de données que vous créez.

Remarque :

Vous pouvez configurer les paramètres d'encodage via ce champ.

Commit every

Nombre de lignes à inclure dans le lot avant de commencer l'écriture dans la base. Cette option assure la qualité de la transaction (mais pas le rollback) et permet une meilleure performance lors de l'exécution.

Additional Columns

Cette option n'est pas disponible si vous créez (avec ou sans suppression) la table de base de données. Cette option vous permet d'appeler des fonctions SQL afin d'effectuer des actions sur des colonnes, à l'exclusion des actions d'insertion, de mise à jour, de suppression ou qui nécessitent un prétraitement particulier.

 

Name : saisissez le nom de la colonne à modifier ou à insérer.

 

SQL expression : saisissez l'instruction SQL à exécuter afin de modifier ou d'insérer les données de la colonne souhaitée.

 

Position : sélectionnez Before, Replace ou After, selon l'action à effectuer sur la colonne de référence.

 

Reference column : saisissez une colonne de référence que le composant tDBOutput peut utiliser pour placer ou remplacer la nouvelle colonne ou la colonne modifiée.

Use field options

Cochez cette case pour personnaliser une requête, surtout lorsqu'il y a plusieurs actions sur les données.

Enable debug mode

Cochez cette case pour afficher chaque étape du processus d'écriture dans la base de données.

Use java.sql.Statement

Cochez cette case pour utiliser l'objet Statement au cas où l'objet PreparedStatement ne soit pas supporté par certains DBMS.

Statistiques du tStatCatcher

Cochez cette case afin de collecter les données de log au niveau du composant.

Enable parallel execution

Cocher cette case permet de traiter plusieurs flux de données simultanément. Cela permet de traiter les données plus rapidement. Notez que cette fonctionnalité dépend de la capacité de la base de données ou de l'application à gérer plusieurs insertions en parallèle ainsi que le nombre de processeurs utilisés. Dans le champ Number of parallel executions, vous pouvez :
  • Saisir le nombre d'exécutions parallèles désiré.

  • Appuyer sur Ctrl+Espace et sélectionner la variable de contexte dans la liste. Pour plus d'informations, consultez le Guide utilisateur du Studio Talend .

  • Le champ Action on table n'est pas disponible avec la fonction de parallélisation. Ainsi, pour créer une table, vous devez utiliser un composant tCreateTable.

  • Lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-job.

Variables globales

Global Variables

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

NB_LINE_UPDATED : nombre de lignes mises à jour. Cette variable est une variable After et retourne un entier.

NB_LINE_INSERTED : nombre de lignes insérées. Cette variable est une variable After et retourne un entier.

NB_LINE_DELETED : nombre de lignes supprimées. Cette variable est une variable After et retourne un entier.

NB_LINE_REJECTED : nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend .

Utilisation

Règle d'utilisation

Ce composant couvre toutes les possibilités de requête SQL dans les bases de données utilisant une connexion SAS.

Ce composant est généralement utilisé comme composant de sortie. Il permet de faire des actions sur une table ou les données d'une table d'une base de données MaxDB. Il permet aussi de créer un flux de rejet avec un lien Row > Rejects filtrant les données en erreur. Pour un scénario associé, consultez Récupérer les données erronées à l'aide d'un lien Reject.