Propriétés du tVerticaOutputBulkExec Standard - 7.1

Vertica

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants Vertica
Gouvernance de données > Systèmes tiers > Composants Database > Composants Vertica
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Vertica
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tVerticaOutputBulkExec s'exécutant dans le framework de Jobs Standard.

Le composant tVerticaOutputBulkExec Standard appartient à la famille Databases.

Le composant de ce framework est disponible dans tous les produits Talend.

Remarque : Ce composant est une version spécifique d'un connecteur à une base de données dynamique. Les propriétés associées aux paramètres de la base de données dépendent du type de base de données sélectionné. Pour plus d'informations concernant les connecteurs aux bases de données, consultez Utiliser des composants de bases de données dynamiques.

Basic settings

Database

Sélectionnez un type de base de données dans la liste et cliquez sur Apply.

Property Type

Sélectionnez la manière de configurer les informations de connexion.

  • Built-In : les paramètres de connexion seront définis localement pour ce composant. Vous devez spécifier manuellement les valeurs pour toutes les propriétés de connexion.

  • Repository : les paramètres de connexion stockés centralement dans le Repository > Metadata seront réutilisés par ce composant. Vous devez cliquer sur le bouton [...] et, dans la boîte de dialogue Repository Content, sélectionnez les détails de connexion à réutiliser. Toutes les propriétés de connexion seront automatiquement renseignées.

DB Version

Sélectionnez la version de la base de données.

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

Notez que lorsqu'un Job contient un Job parent et un Job enfant, si vous devez partager une connexion existante entre ces deux niveaux, par exemple pour partager la connexion créée par le Job père au Job fils, vous devez :

  1. au niveau du Job père, enregistrer la connexion à la base de données à partager dans la vue Basic settings du composant de connexion créant cette connexion à la base de données.

  2. au niveau du Job fils, utiliser un composant de connexion dédié afin de lire cette connexion enregistrée.

Pour un exemple de partage d'une connexion à une base de données à travers différents niveaux de Jobs, consultez le Guide utilisateur du Studio Talend .

Host

Adresse IP ou le nom d'hôte de la base de données.

Port

Numéro du port d'écoute de la base de données.

DB Name

Nom de la base de données.

Schema

Schéma de la base de données.

Username et Password

Données d'authentification de l'utilisateur de la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Action on data

Sélectionnez une action à effectuer sur les données de la table définie.

  • Bulk insert : insère plusieurs lignes dans la table en une fois, au lieu d'insérer les lignes une par une. Le Job s'arrête lorsqu'il détecte des doublons.

  • Bulk update : effectue plusieurs mises à jour simultanées sur différentes lignes.

Table

Nom de la table dans laquelle écrire les données.

Action on table

Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :

  • Default : n'effectuer aucune opération de table.

  • Drop and create table : la table est supprimée et de nouveau créée.

  • Create table : la table n'existe pas et est créée.

  • Create table if does not exist : créer la table si elle n'existe pas encore.

  • Drop table if exists and create : supprimer la table si elle existe déjà, puis en créer une nouvelle.

  • Clear table : le contenu de la table est supprimé. Vous pouvez annuler cette opération.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement. scénario associé : consultez le Guide utilisateur du Studio Talend .

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Scénario associé : consultez le Guide utilisateur du Studio Talend .

Lorsque le schéma à réutiliser contient des valeurs par défaut de type Integer ou Function, assurez-vous que ces valeurs par défaut ne sont pas entourées de guillemets. Si elles le sont, supprimez manuellement les guillemets.

Pour plus d'informations, consultez Vérification des valeurs par défaut dans un schéma récupéré.

Modifiez le schéma en cliquant sur Edit Schema. Notez que si vous effectuez des modifications, le schéma passe automatiquement en type built-in.

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

File Name

Chemin d'accès au fichier à générer.

Ce fichier est généré sur la machine où est installé votre Studio ou sur celle où votre Job utilisant ce composant est déployé.

Append

Cochez cette option pour ajouter des nouvelles lignes à la fin du fichier.

Use schema columns for Copy

Cochez cette case pour utiliser l'option de colonne dans l'instruction COPY afin de restreindre la charge à une ou plusieurs colonne(s) spécifiée(s) dans la table. Pour plus d'informations, consultez Vertica COPY SQL Statement (en anglais).

Advanced settings

Additional JDBC Parameters

Spécifiez des paramètres JDBC supplémentaires pour la connexion à la base de données en cours de création.

Cette propriété n'est pas disponible lorsque la case Use an existing connection est cochée.

Stream name

Nom du flux d'un chargement, permettant d'identifier un chargement particulier.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Write to ROS (Read Optimized Store)

Cochez cette case pour stocker les données dans une zone de chargement physique, pour en optimiser la lecture, lors de la compression et du pré-tri des données.

Exit Job if no row was loaded

Le Job s'arrête automatiquement si aucune ligne n'est chargée.

Missing columns as null

Cochez cette case pour insérer des valeurs NULL pour les colonnes manquantes lorsque les données sont insuffisantes pour correspondre aux colonnes spécifiées dans le schéma.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Skip Header

Cochez cette case et, dans le champ qui s'affiche, spécifiez le nombre d'enregistrements à ignorer dans le fichier.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Record terminator

Cochez cette case et, dans le champ qui s'affiche, spécifiez la chaîne de caractères littéraux utilisée pour indiquer la fin de chaque enregistrement dans le fichier.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Enclosed by character

Cochez cette case pour configurer le caractère entourant les données.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Field Separator

Caractère, chaîne de caractères ou expression régulière pour séparer les champs.

Null string

Chaîne de caractères affichée pour indiquer que la valeur est nulle.

Include Header

Cochez cette case pour inclure l'en-tête de la colonne dans le fichier.

Encoding

Sélectionnez l'encodage dans la liste, ou sélectionnez CUSTOM et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données de base de données.

Reject not fitted values

Cochez cette case pour rejeter les lignes de données de type char, varchar, binary et varbinary si elles ne vont pas dans la table cible.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Maximum number of rejected records

Cochez cette case et, dans le champ qui s'affiche, spécifiez le nombre maximal d'enregistrements pouvant être rejetés avant échec du chargement.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Stop and rollback if any row is rejected

Cochez cette case pour arrêter un chargement et effectuer un rollback sans charger de données si la moindre ligne est rejetée.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Don't commit

Cochez cette case pour effectuer une transaction de chargement de masse sans commiter automatiquement les résultats. Cette option est utile si vous souhaitez exécuter plusieurs chargements de masse en une seule transaction.

Cette propriété est disponible uniquement lorsque vous utilisez Vertica 6.0 ou une version supérieure.

Rejected data file

Spécifiez le fichier dans lequel écrire les lignes rejetées.

Cette propriété est disponible uniquement lorsque l'action Bulk insert est sélectionnée dans la liste Action on data.

Exception log file

Spécifiez le fichier dans lequel écrire le log des exceptions. Ce log explique pourquoi chaque ligne rejetée est rejetée.

Cette propriété est disponible uniquement lorsque l'action Bulk insert est sélectionnée dans la liste Action on data.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

ACCEPTED_ROW_NUMBER

Nombre de lignes à charger dans la base de données. Cette variable est une variable After et retourne un entier.

REJECTED_ROW_NUMBER

Nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE

Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères.

Utilisation

Règle d'utilisation

Ce composant est principalement utilisé lorsqu'aucune transformation particulière n'est requise sur les données à charger dans la base de données.

Le Studio Talend et la base de données Vertica permettent de créer des applications d'entrepôt de données et de datamart très rapides et abordables. Pour plus d'informations concernant la manière de configurer le Studio Talend pour se connecter à Vertica, consultez Talend and HP Vertica Tips and Techniques (en anglais).