tIngresBulkExec

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Data Quality
Talend Open Studio for Big Data
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Open Studio for Data Integration
task
Gouvernance de données
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Les composants tIngresOutputBulk et tIngresBulkExec sont généralement utilisés ensemble pour d'une part générer en sortie le fichier qui sera d'autre part utilisé comme paramètre dans l'exécution de la requête SQL énoncée. Cette exécution en deux étapes est unifiée dans le composant tIngresOutputBulkExec, détaillé dans une section séparée. L'intérêt de proposer deux composants séparés réside dans le fait que cela permet de procéder à des transformations avant le changement des données dans la base de données.

Fonction

Le composant tIngresBulkExec effectue une action d'insertion (INSERT) sur les données fournies.

Objectif

Le tIngresBulkExec vous permet d'insérer des données en masse dans une table du SGBD Ingres, afin d'optimiser les performances.

Propriétés du tIngresBulkExec

Famille du composant

Databases/Ingres

 

Basic settings

Property type

Peut être Built-in ou Repository

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier dans lequel sont stockées les propriétés du composant. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

 

Table

Nom de la table à remplir.

 

VNode

Nom du nœud virtuel.

 

Database

Nom de la base de données.

 

Action on table

Actions pouvant être effectuées sur la table :

None : Aucune opération.

Truncate : Supprime toutes les lignes de la table et rend l'espace du fichier au système d'exploitation.

  File name

Nom du fichier à charger.

Avertissement

Ce fichier doit se situer sur la même machine que le serveur de la base de données.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

 

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Lorsque le schéma à réutiliser contient des valeurs par défaut, qui sont des entiers (integer) ou des fonctions (function), assurez-vous que les valeurs par défaut ne sont pas entourées de guillemets. Si c'est le cas, vous devez supprimer manuellement les guillemets.

Pour plus d'informations, consultez l'article Vérification des valeurs par défaut dans un schéma récupéré sur Talend Help Center (https://help.talend.com).

  

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

Delete Working Files After Use

Cochez cette case pour supprimer les fichiers créés durant l'exécution.

Advanced settings

Field Separator

Saisissez le caractère, la chaîne de caractères ou l'expression régulière permettant de séparer les champs.

 

Row Separator

Chaîne de caractères (ex : "\n" sous Unix) permettant de séparer les lignes.

 

Null Indicator

Valeur de l'indicateur null.

 

Session User

Utilisateur de la session définie (connexion à la base de données).

 

Rollback

Activer ou désactiver le rollback.

 

On Error

Politique de gestion d'erreur :

Continue : Continuer l'exécution.

Terminate : Terminer l'exécution.

 

Reject Row File

Chemin d'accès et nom du fichier contenant les lignes rejetées.

Disponible lorsque l'option Continue est sélectionnée dans la liste On Error.

 

Error Count

Nombre d'erreurs avant arrêt de l'exécution.

Disponible lorsque l'option Terminate est sélectionnée dans la liste On Error.

 

Allocation

Nombre de pages initialement allouées à la table ou à l'index.

 

Extend

Nombre de pages étendant la table ou l'index.

 

Fill Factor

Spécifiez le pourcentage (de 1 à 100) de chaque page principale de données devant être remplie de lignes, dans des conditions idéales. Par exemple, si vous spécifiez un facteur de remplissage de 40, le serveur de SGBD remplit de lignes 40% de chaque page principale dans la table restructurée.

 

Min Pages/Max Pages

Spécifiez le nombre minimum/maximum de pages principales qu'une table de hachage doit posséder. Ces nombres doivent être de 1 minimum.

 

Leaf Fill

Une copie de masse peut spécifier une valeur leaffill. Cette clause spécifie le pourcentage (de 1 à 100) de chaque index de page de table B-tree devant être remplie par des lignes durant la copie. Cette clause peut être utilisée uniquement sur des tables ayant une structure de stockage B-tree.

 

Non Leaf Fill

Une copie de masse peut spécifier une valeur nonleaffill. Cette clause spécifie le pourcentage (de 1 à 100) de chaque index de page de table B-tree ne devant pas être rempli par des lignes durant la copie. Cette clause peut être utilisée uniquement sur des tables ayant une structure de stockage B-tree.

 

Row Estimate

Spécifiez le nombre estimé de lignes à copier d'un fichier à une table durant l'opération de copie de masse.

 

Trailing WhiteSpace

Cochée par défaut, cette case est conçue pour supprimer les espaces en fin de champ et s'applique uniquement aux types de données VARCHAR, NVARCHAR et TEXT.

 

Output

Emplacement où écrire le message d'erreur :

to console : Ecrire le message dans la console.

to global variable : Ecrire le message dans une variable globale.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables 

NB_LINE_DATA : nombre de lignes lues. Cette variable est une variable After et retourne un entier.

NB_LINE_BAD : nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Le composant tIngresBulkExec est généralement utilisé avec le tIngresConnection et le tIngresRow. Il permet d'alimenter en masse une base de données Ingres, afin d'optimiser les performances.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Limitation

Le serveur/client de la base de données doit être installé sur la même machine que le Studio Talend ou que le Job contenant un tIngresBulkExec, afin que le composant fonctionne correctement.

Du fait d'une incompatibilité de licence, un ou plusieurs Jar requis pour utiliser ce composant ne sont pas fournis. Vous pouvez installer les Jar manquants pour ce composant en cliquant sur le bouton Install dans l'onglet Component. Vous pouvez également trouver les Jar manquants et les ajouter dans l'onglet Modules de la perspective Integration de votre studio. Pour plus d'informations, consultez l'article Installation de modules externes sur Talend Help Center (https://help.talend.com) ou la section décrivant comment configurer le studio, dans le Guide d'installation et de migration Talend.

Scénario associé

Pour un scénario associé, consultez :