Propriétés du tOracleOutputBulkExec - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Les composants tOracleOutputBulk et tOracleBulkExec sont généralement utilisés ensemble comme deux parties d'un processus en deux étapes. Dans la première étape, un fichier de sortie est généré. Dans la deuxième étape, ce fichier est utilisé lors de l'opération d'INSERT afin de peupler une base de données. Cette exécution en deux étapes est unifiée dans le composant tOracleOutputBulkExec.

Famille du composant

Databases/Oracle

 

Fonction

Le tOracleOutputBulkExec effectue une action d'Insert sur les données fournies.

Objectif

Ce composant est un composant dédié qui permet un gain de performance pendant les opérations d'Insert dans une base de données Oracle.

Basic settings

Property type

Peut être Built-in ou Repository..

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier de propriétés du composant. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

 

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat à partir de la liste Component List pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

Note

Lorsqu'un Job contient un Job parent et un Job enfant, si vous souhaitez utiliser une connexion existant entre les deux niveaux, par exemple pour partager la connexion créée par le Job parent avec le Job enfant, vous devez :

  1. Au niveau parent, enregistrer la connexion à la base de données à partager, dans la vue Basic settings du composant de connexion créant cette connexion.

  2. Au niveau enfant, utiliser un composant dédié à la création de connexion, afin de lire la connexion enregistrée.

Pour plus d'informations concernant le partage d'une connexion à travers différents niveaux de Jobs, consultez le Guide utilisateur du Studio Talend.

 

Connection type

Liste déroulante des pilotes disponibles :

Oracle OCI : Sélectionnez ce type de connexion pour utiliser l'interface d'appel de la base de données Oracle ( Oracle Call Interface) accompagnée d'un ensemble de logiciels API de langage C qui fournissent une interface à cette base de données Oracle.

Oracle Service Name : Sélectionnez ce type de connexion pour utiliser l'alias TNS que vous fournissez lorsque vous vous connectez à la base de données distante.

Oracle SID : Sélectionnez ce type de connexion pour identifier exclusivement une base de données spécifique sur un système.

Oracle Custom : Sélectionnez ce type de connexion pour accéder à une base de données contenant des clusters.

 

DB Version

Sélectionnez la version d'Oracle que vous utilisez.

 

Host

Adresse IP du serveur de la base de données.

Seuls localhost, 127.0.0.1 ou l'adresse IP exacte de la machine locale permettent un fonctionnement optimal. Le serveur de la base de données doit être installé sur la même machine que le Studio Talend ou le Job contenant un tOracleOutputBulkExec.

 

Port

Numéro du port d'écoute du serveur de base de données.

 

Database

Nom de la base de données.

 

Schema

Nom du schéma.

 

Username et Password

Informations d'authentification de l'utilisateur de base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles, puis cliquez sur OK afin de sauvegarder les paramètres.

 

Table

Nom de la table à écrire. Notez qu'une seule table peut être écrite à la fois et la table doit déjà exister pour que l'opération d'Insert soit autorisée.

 

Action on table

Vous pouvez effectuer l'une des opérations suivantes sur les données de la table sélectionnée :

None : n'effectuer aucune opération de table.

Drop and create table : supprimer la table puis en créer une nouvelle.

Create table : créer une table qui n'existe pas encore.

Create table if not exists : créer la table si nécessaire.

Drop table if exists and create : supprimer la table si elle existe déjà, puis en créer une nouvelle.

Clear table : supprimer le contenu de la table.

Truncate table : supprimer rapidement le contenu de la table, mais sans possibilité de Rollback.

 

File Name

Nom du fichier à générer et à charger.

Avertissement

Ce fichier est généré sur la machine spécifiée par l'URI dans le champ Host et doit être sur la même machine que le serveur de la base de données.

 

Create directory if not exists

Cette case est cochée par défaut. Cette option permet de créer un répertoire où stocker la table de sortie si elle n'existe pas.

 

Append

Cochez cette case afin d'ajouter de nouvelles lignes à la fin de l'enregistrement.

 

Action on data

Vous pouvez effectuer les opérations suivantes sur les données de la table sélectionnée :

Insert : Insérer des données dans une table vide. Si la table contient déjà des données, le Job s'arrête et les données existantes restent dans la table.

Update : Mettre à jour les données existantes. Il est nécessaire de configurer la clé du schéma lorsque cette option est sélectionnée.

Append : Ajouter des données à la table, que celle-ci soit vide ou non.

Replace : Si la table contient déjà des données, supprime toutes les données existantes et insère les nouvelles données. Si la table est vide, insère les nouvelles données.

Truncate : Si la table contient déjà des données, tronque toutes les données existantes et insère les nouvelles données. Si la table est vide, insère les nouvelles données.

Avertissement

Il est nécessaire de spécifier au minimum une clé de recherche sur laquelle baser les opérations d'Update. Il est possible de définir les colonnes qui agiront comme clé de recherche à partir du schéma, pour une utilisation de base, ou à partir des options avancées (Advanced settings) pour une utilisation optimisée de ces opérations.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Lorsque le schéma à réutiliser contient des valeurs par défaut, qui sont des entiers (integer) ou des fonctions (function), assurez-vous que les valeurs par défaut ne sont pas entourées de guillemets. Si c'est le cas, vous devez supprimer manuellement les guillemets.

Pour plus d'informations, consultez https://help.talend.com/display/KB/Verifying+default+values+in+a+retrieved+schema (en anglais).

 

Field separator

Caractère, chaîne de caractères ou expression régulière pour séparer les champs.

Advanced settings

Advanced separator (for numbers)

Cochez cette option pour modifier les séparateurs utilisés pour les nombres :

Thousands separator : définissez le séparateur utilisé pour les milliers.

Decimal separator : définissez le séparateur utilisé pour les décimaux.

 

Use existing control file

Cochez cette case si vous utilisez un fichier de contrôle (.ctl).

 

Record format

Définissez le format de l'enregistrement :

Default : les paramètres du format sont définis par défaut.

Stream : déterminez le séparateur de fin d'enregistrement.

Fixed : déterminez la longueur d'enregistrement.

Variable : déterminez la taille du champ spécifiant la longueur de l'enregistrement.

 

Specify .ctl file's INTO TABLE clause manually

Cochez cette case pour renseigner manuellement la clause INTO TABLE du fichier de contrôle, directement dans le code.

 

Fields terminated by

Caractère, chaîne ou expression régulière séparant les champs :

None : aucun caractère de séparation.

Whitespace : le caractère de séparation est un espace.

EOF (used for loading LOBs from lobfile) : la séparation est constituée d'un caractère de fin de fichier (End Of File).

Other terminator : la séparation est constituée d'un caractère autre que ceux précédemment énoncés.

 

Use fields enclosure

Cochez cette case si vous voulez utiliser des caractères pour entourer le texte :

Fields enclosure (left part) : caractère délimitant les champs sur la gauche.

Field enclosure (right part) : caractère délimitant les champs sur la droite.

 

Use schema's Date Pattern to load Date field

Cochez cette case pour utiliser le modèle de date contenu dans le schéma pour remplir le champ concernant la date.

 

Specify field condition

Cochez cette case pour définir une condition de chargement des données.

 

Preserve blanks

Cochez cette case pour conserver les espaces vides.

 

Trailing null columns

Cochez cette case pour charger des données avec des colonnes vides.

 

Load options

Cliquez sur le bouton [+] afin d'ajouter des options de chargement des données :

Parameter : choisissez l'un des paramètres de chargement à partir de la liste déroulante.

Value : définissez la valeur à attribuer au paramètre.

 

NLS Language

A partir de la liste déroulante, définissez la langue utilisée pour les données qui ne sont pas codées en Unicode.

 

Set Parameter NLS_TERRITORY

Cochez cette case pour modifier les conventions d'appellation utilisées pour la numérotation des jours et des semaines. La valeur par défaut est celle du système d'exploitation.

 

Encoding

Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données de base de données.

 

Oracle encoding type

Sélectionnez le type d'encodage spécifique à Oracle pour le traitement des données. Ce type d'encodage permet au tOracleOutputBulkExec de générer correctement la commande Oracle de masse.

 

Output

Sélectionnez dans la liste déroulante l'endroit où rediriger le flux de sortie :

to console : vers la console de log.

to global variable : vers une variable globale.

 

Convert columns and table names to uppercase

Cochez cette case pour mettre le nom des colonnes et celui de la table en majuscules.

  Bulk file parameters Configurez les paramètres Buffer Size et StringBuilder Size afin d'optimiser les performances selon la mémoire.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Dynamic settings

Cliquez sur le bouton [+] pour ajouter une ligne à la table. Dans le champ Code, saisissez une variable de contexte afin de sélectionner dynamiquement votre connexion à la base de données parmi celles prévues dans votre Job. Cette fonctionnalité est utile si vous devez accéder à plusieurs tables de bases de données ayant la même structure mais se trouvant dans différentes bases de données, en particulier lorsque vous travaillez dans un environnement dans lequel vous ne pouvez pas changer les paramètres de votre Job, par exemple lorsque votre Job doit être déployé et exécuté dans un Studio Talend indépendant.

La table Dynamic settings n'est disponible que si la case Use an existing connection est cochée dans la vue Basic settings. Lorsqu'un paramètre dynamique est configuré, la liste Component List devient inaccessible dans la vue Basic settings.

Pour des exemples sur l'usage des paramètres dynamiques, consultez Scénario 3 : Lire des données dans des bases de données MySQL à l'aide de connexions dynamiques basées sur les variables de contexte et Scénario : Lire des données à partir de différentes bases de données MySQL à l'aide de paramètres de connexion chargés dynamiquement. Pour plus d'informations concernant les Dynamic settings et les variables de contexte, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est principalement utilisé lorsqu'aucune transformation particulière n'est requise sur les données à charger dans la base de données.

Limitation

Le serveur/client de la base de données doit être installé sur la même machine que le Studio Talend ou que le Job contenant un tOracleOutputBulkExec, afin que le composant fonctionne correctement.