Propriétés du tPostgresqlOutputBulkExec - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Les composants tPostgresqlOutputBulk et tPostgresqlBulkExec sont généralement utilisés ensemble comme deux parties d'un processus en deux étapes. Dans la première étape, un fichier de sortie est généré. Dans la deuxième étape, ce fichier est utilisé lors de l'opération d'INSERT afin de peupler une base de données. Cette exécution en deux étapes est unifiée dans le composant tPostgresqlOutputBulkExec.

Famille de composant

Databases/Postgresql

 

Fonction

Le tPostgresqlOutputBulkExec effectue une action d'Insert sur les données fournies.

Objectif

Le tPostgresqlOutputBulkExec est un composant dédié qui permet un gain de performance pendant les opérations d'Insert dans une base de données Postgresql.

Basic settings

Property type

Peut être Built-in ou Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier de propriétés du composant. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

 

DB Version

Liste des versions de la base de données.

 

Host

Adresse IP du serveur de base de données.

localhost, 127.0.0.1 et l'adresse IP exacte de la machine locale permettent un bon fonctionnement. Le serveur de base de données doit être installé sur la même machine que le Studio Talend ou le Job comprenant le tPostgresqlOutputBulkExec.

 

Port

Numéro du port d'écoute du serveur de base de données.

 

Database

Nom de la base de données.

 

Schema

Nom exact du schéma.

 

Username et Password

Informations d'authentification de l'utilisateur de base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles, puis cliquez sur OK afin de sauvegarder les paramètres.

 

Table

Nom de la table à écrire. Notez qu'une seule table peut être écrite à la fois et la table doit déjà exister pour que l'opération d'Insert soit autorisée.

 

Action on table

Vous pouvez effectuer l'une des opérations suivantes sur les données de la table sélectionnée :

None: n'effectuer aucune opération de table.

Drop and create table: supprimer la table puis en créer une nouvelle.

Create table: créer une table qui n'existe pas encore.

Create table if not exists: créer la table si nécessaire.

Drop table if exists and create: supprimer la table si elle existe déjà, puis en créer une nouvelle.

Clear a table: supprimer le contenu de la table.

 

File Name

Nom du fichier à générer et à charger.

Avertissement

Le fichier est généré sur la machine spécifiée par l'URI dans le champ Host et doit être sur la même machine que le serveur de la base de données.

 

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Lorsque le schéma à réutiliser contient des valeurs par défaut, qui sont des entiers (integer) ou des fonctions (function), assurez-vous que les valeurs par défaut ne sont pas entourées de guillemets. Si c'est le cas, vous devez supprimer manuellement les guillemets.

Pour plus d'informations, consultez https://help.talend.com/display/KB/Verifying+default+values+in+a+retrieved+schema (en anglais).

Advanced settings

Action on data

Sélectionnez l'opération que vous voulez effectuer :

Bulk insert : ajoute différentes entrées à la table. Si des doublons sont trouvés, le Job s'arrête.

Bulk update : effectue des modifications simultanées dans différentes entrées.

 

Copy the OID for each row

Récupère les identifiants d'objet pour chaque ligne.

 

Contains a header line with the names of each column in the file

Spécifiez que la table contient des lignes d'en-tête.

 

Encoding

Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données de base de données.

 

File type

Sélectionnez le type de fichiers à traiter.

 

Null string

Chaîne de caractères affichée pour signifier que la valeur est nulle.

 

Row separator

Chaîne (ex : "\n" sous Unix) séparant les lignes.

 

Fields terminated by

Caractère, chaîne ou expression régulière séparant les champs.

 

Escape char

Caractère d'échappement de la ligne.

 

Text enclosure

Caractères utilisés pour entourer le texte.

 

Activate standard_conforming_string

Activez le paramètre standard_conforming_string pour traiter les backslashs comme une chaîne ordinaire et non pas comme un caractère d'échappement.

 

Force not null for columns

Définissez la nullabilité des colonnes.

Force not null : Cochez la case correspondant à la colonne (Column) que vous souhaitez définir comme n'étant pas nulle.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Utilisation

Ce composant est principalement utilisé lorsqu'aucune transformation particulière n'est requise sur les données à charger dans la base de données.

LimitationLe serveur de base de données doit être installé sur la même machine que le Studio Talend ou le Job comprenant un tPostgresqlOutputBulkExec afin que le composant fonctionne correctement.