Propriétés du tExasolBulkExec Standard - Cloud - 8.0

Exasol

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Database (Intégration) > Composants Exasol
Gouvernance de données > Systèmes tiers > Composants Database (Intégration) > Composants Exasol
Qualité et préparation de données > Systèmes tiers > Composants Database (Intégration) > Composants Exasol
Last publication date
2024-02-21

Ces propriétés sont utilisées pour configurer le tExasolBulkExec s'exécutant dans le framework de Jobs Standard.

Le composant tExasolBulkExec Standard appartient à la famille Bases de données.

Le composant de ce framework est disponible dans tous les produits Talend.

Paramètres simples

Use an existing connection

Cochez cette case et, dans la liste qui s'affiche, sélectionnez le composant de connexion permettant de réutiliser les informations de connexion précédemment définies.

Remarque : Lorsqu'un Job contient un Job parent et un Job enfant, si vous devez partager une connexion existante entre ces deux niveaux, par exemple pour partager la connexion créée par le Job parent au Job enfant, procédez comme suit.
  1. au niveau du Job parent, enregistrer la connexion à la base de données à partager dans la vue Basic settings du composant de connexion créant cette connexion à la base de données.
  2. au niveau du Job enfant, utiliser un composant de connexion dédié afin de lire cette connexion enregistrée.

Pour un exemple de partage d'une connexion à une base de données à travers différents niveaux de Jobs, consultez Partager une connexion à une base de données.

Property Type

Peut-être Built-In ou Repository.

  • Built-in : Propriétés utilisées ponctuellement.

  • Repository : sélectionnez le référentiel dans lequel sont stockées les propriétés. Les champs de connexion à la base de données suivants sont alors remplis automatiquement à l'aide des données collectées.

Host

Saisissez l'hôte ou la liste d'hôtes des serveurs de bases de données Exasol. Exasol peut s'exécuter dans un environnement de cluster. Une valeur valide peut être une adresse IP simple (par exemple 172.16.173.128), une liste d'adresses IP (par exemple 172.16.173.128..130 qui représente trois serveurs 172.16.173.128, 172.16.173.129, et 172.16.173.130), ou une liste d'hôtes séparés par des virgules (par exemple server1,server2,server3) du cluster de base de données Exasol.

Port

Saisissez le numéro du port d'écoute du cluster de la base de données Exasol.

Schema

Saisissez le nom du schéma que vous souhaitez utiliser.

User et Password

Saisissez les données d'authentification de l'utilisateur ou de l'utilisatrice pour accéder à la base de données Exasol.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Table

Saisissez le nom de la table à écrire.

Remarque : Généralement, les noms de tables sont stockés en majuscules. Si vous utilisez des identifiants contenant des minuscules et des majuscules, saisissez le nom entre guillemets doubles. Par exemple, "\"TEST_data_LOAD\"".

Action on table

Vous pouvez effectuer l'une des opérations suivantes sur les données de la table sélectionnée avant import :

  • None : aucune opération n'est effectuée.

  • Drop and create table : la table est supprimée et de nouveau créée.

  • Create table : la table n'existe pas et est créée.

  • Create table if not exists : la table est créée si elle n'existe pas.

  • Truncate table : le contenu de la table est supprimé. Vous ne pouvez pas annuler cette opération.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Remarque : Les colonnes du schéma doivent être dans le même ordre que dans le fichier .csv. Il n'est pas nécessaire de renseigner toutes les colonnes de la table définie, sauf si le scénario ou la définition de la table attend ce renseignement.

 

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

    Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Advanced settings

Additional JDBC Parameters

Définissez des propriétés de connexion supplémentaires pour la connexion à la base de données que vous créez. Les propriétés sont séparées par un point-virgule et chaque propriété est une paire clé-valeur. Par exemple, encryption=1;clientname=Talend.

Ce champ n'est pas disponible si la case Use an existing connection est cochée.

Column Formats

Spécifiez le format pour les colonnes de type Date et Numeric si le type par défaut ne peut être appliqué.

  • Column : les cellules de cette colonne sont automatiquement renseignées par les noms définis des colonnes du schéma.

  • Has Thousand Delimiters : cochez cette case si la valeur de la colonne Numeric correspondante (colonnes Numeric uniquement) du fichier contient des séparateurs de milliers.

  • Alternative Format : spécifiez le format nécessaire comme une valeur String si un format spécial est attendu. Le format nécessaire sera créé à partir de la longueur de la précision de la colonne du schéma. Pour plus d'informations concernant les modèles de format, consultez Exasol User Manual (en anglais).

Source table columns

Si la source est une base de données, configurez dans cette table le mapping entre les colonnes source et cible.

La configuration du mapping est facultative. Si vous ne configurez rien ici, il est supposé que la table source a la même structure que la base de données cible.

  • Column : colonne du schéma dans la table cible.

  • Source column name : nom de la colonne dans la table source.

Column Separator

Saisissez le séparateur des colonnes au sein d'une ligne dans le fichier local.

Column Delimiter

Saisissez le séparateur de contenu des champs dans le fichier local.

Row Separator

Saisissez le caractère utilisé pour séparer les lignes dans le fichier local.

Null representation

Saisissez la chaîne de caractères représentant une valeur NULL dans le fichier local. Si rien n'est spécifié, les valeurs nulles sont représentées par une chaîne de caractères vide.

Skip rows

Saisissez le nombre de lignes à omettre (par exemples un en-tête ou d'autres préfixes).

Encoding

Saisissez le jeu de caractères utilisé dans le fichier local. Par défaut, l'encodage est UTF8.

Trim column values

Spécifiez si les espaces doivent être coupés au bord des colonnes .csv.

  • No trim : ne couper aucun espace.

  • Trim : couper les espaces à gauche et à droite.

  • Trim only left : ne couper que les espaces à gauche.

  • Trim only : ne couper que les espaces à droite.

Default Date Format

Spécifiez le format de la date. Par défaut, le format est YYYY-MM-DD.

Default Timestamp Format

Spécifiez le format de l'heure système. Par défaut, le format est YYYY-MM-DD HH24:MI:SS.FF3.

Thousands Separator

Spécifiez le caractère utilisé pour séparer les groupes de milliers dans une valeur numérique. Au format Numeric, le caractère sera appliqué sur le paramètre substituable G. Si les valeurs de texte contiennent ce caractère, vous devez également le configurer dans la table Column Formats.

Notez que ce paramètre affecte la propriété de connexion NLS_NUMERIC_CHARACTERS définissant les caractères décimaux et les caractères de groupe utilisés pour représenter les nombres.

Decimal Separator

Spécifiez le caractère utilisé pour séparer les parties entières des nombres des parties décimales. Au format Numeric, le caractère sera appliqué sur le paramètre substituable D.

Notez que ce paramètre affecte la propriété de connexion NLS_NUMERIC_CHARACTERS définissant les caractères décimaux et les caractères de groupe utilisés pour représenter les nombres.

Minimal number errors to reject the transfer

Spécifiez le nombre maximum de lignes non valides autorisées lors du traitement de chargement des données. Par exemple, la valeur 2 signifie que le processus de chargement s'arrête si une troisième erreur survient.

Log Error Destination

Spécifiez l'emplacement où vous souhaitez conserver les messages d'erreur.

  • No Logging : les messages d'erreur ne sont pas sauvegardés.

  • Local Log File : les messages d'erreur sont stockés dans un fichier local spécifié.

    • Local Error Log File : spécifiez le chemin d'accès au fichier local stockant les messages d'erreur.

    • Add current timestamp to log file name (before extension) : cochez cette case pour ajouter la date et l'heure courantes avant l'extension du nom de fichier pour des raisons d'identification, si vous utilisez plusieurs fois le même fichier.

  • Logging Table : les messages d'erreur sont sauvegardés dans une table spécifiée. Cette table est créée si elle n'existe pas.

    • Error Log Table : saisissez le nom de la table stockant les messages d'erreur.

    • Use current timestamp to build log table : cochez cette case pour utiliser la date et l'heure courantes pour construire la table de log, pour des raisons d'identification, si vous utilisez plusieurs fois la même table.

Transfer files secure

Cochez cette case pour transférer le fichier via HTTPS au lieu de HTTP.

Test mode (no statements are executed)

Cochez cette case pour exécuter le composant en mode test, dans lequel aucune instruction n'est exécutée.

Use precision and length from schema

Cochez cette case pour vérifier les valeurs des colonnes de types numériques (Double, Float, BigDecimal, Integer, Long et Short) par rapport au paramètre Length (qui configure le nombre de chiffres) et au paramètre Precision (qui configure le nombre de chiffres décimaux) dans le schéma. Seules les valeurs n'ayant ni d'entier ni de décimal supérieur aux paramètres Length et Precision sont chargés.

Par exemple, avec une longueur Length configurée à 4 et une précision Precision configurée à 3, les valeurs 8888.8888 et 88888.888 seront ignorées. Les valeurs 8888.88 et 888.888 seront chargées.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

Variables globales

NB_LINE_INSERTED : nombre de lignes insérées. Cette variable est une variable After et retourne un entier.

NB_LINE_DELETED : nombre de lignes supprimées. Cette variable est une variable After et retourne un entier.

FILENAME : nom du fichier traité. Cette variable est une variable After et retourne une chaîne de caractères.

ERROR_LOG_FILE : chemin d'accès au fichier local de log. Cette variable est une variable After et retourne une chaîne de caractères.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables.

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé en standalone.

Dynamic settings

Cliquez sur le bouton [+] pour ajouter une ligne à la table. Dans le champ Code, saisissez une variable de contexte afin de sélectionner dynamiquement votre connexion à la base de données parmi celles prévues dans votre Job. Cette fonctionnalité est utile si vous devez accéder à plusieurs tables de bases de données ayant la même structure mais se trouvant dans différentes bases de données, en particulier lorsque vous travaillez dans un environnement dans lequel vous ne pouvez pas changer les paramètres de votre Job, par exemple lorsque votre Job doit être déployé et exécuté indépendamment d'un Studio Talend.

La table Dynamic settings est disponible uniquement lorsque la case Use an existing connection est cochée dans la vue Basic settings. Lorsqu'un paramètre dynamique est configuré, la liste Component List de la vue Basic settings devient inutilisable.

Pour des exemples d'utilisation de paramètres dynamiques, consultez Lire des données dans des bases de données MySQL à l'aide de connexions dynamiques basées sur les variables de contexte et Lire des données à partir de différentes bases de données MySQL à l'aide de paramètres de connexion chargés dynamiquement. Pour plus d'informations concernant les Paramètres dynamiques et les variables de contexte, consultez Schéma dynamique et Créer un groupe de contextes et définir les variables de contexte.