Propriétés du tNetezzaNzLoad Standard

Ces propriétés sont utilisées pour configurer le tNetezzaNzLoad s'exécutant dans le framework de Jobs Standard.

Le composant tNetezzaNzLoad Standard appartient à la famille Bases de données.

Le composant de ce framework est disponible dans tous les produits Talend.

Basic settings

Property type	Peut-être Built-In ou Repository.
	Built-in : propriétés utilisées ponctuellement sans stockage dans le référentiel.
	Repository : sélectionnez le référentiel dans lequel sont stockées les propriétés. Les champs suivants sont automatiquement renseignés à l'aide des données récupérées.
Host	Adresse IP du serveur de base de données.
Port	Numéro du port d'écoute du serveur de base de données.
Database	Nom de la base de données.
Username et Password	Données d'authentification de l’utilisateur ou l'utilisatrice de la base de données. Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.
Table	Nom de la table dans laquelle les données doivent être insérées.
Action on table	Vous pouvez effectuer l'une des opérations suivantes sur les données de la table sélectionnée : None : aucune opération n'est effectuée. Drop and create table : la table est supprimée et de nouveau créée. Create table : la table n'existe pas et est créée. Create table if not exists : la table est créée si elle n'existe pas. Drop table if exists and create : la table est supprimée si elle existe déjà et de nouveau créée. Clear a table : supprimer le contenu de la table avant le chargement des données. Truncate table : exécuter une instruction TRUNCATE avant le chargement des données pour vider entièrement le contenu de la table.
Schema et Edit Schema	Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé `line` lors du nommage des champs.
	Built-in : le schéma est créé et conservé localement pour ce composant seulement.
	Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.
	Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles : View schema : sélectionnez cette option afin de voir uniquement le schéma. Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales. Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.
Data file	Chemin d'accès complet au fichier de données à utiliser. Si ce composant est utilisé seul (non connecté à un autre composant par un flux d'entrée), alors saisissez le nom d'un fichier existant à charger dans la base de données. S'il est connecté à un autre composant par un flux d'entrée, saisissez le nom du fichier à générer et à écrire avec les données d'entrée, afin de l'utiliser plus tard avec nzload pour charger dans la base de données.
Use named-pipe	Cochez cette case afin d'utiliser un tube nommé à la place d'un fichier de données. Cette option ne peut être utilisée que lorsque le composant est connecté à un autre composant par un flux d'entrée. Quand la case est cochée, aucun fichier de données n'est généré, et les données sont transférées à l'utilitaire nzload via un tube nommé. Cette option améliore grandement les performances sous Linux et Windows. Remarque : Ce composant, en mode tube nommé, utilise une interface JNI pour créer un tube nommé et écrire dedans, dans toute plateforme Windows. Le chemin d'accès associé au fichier DLL JNI doit être configuré dans le chemin d'accès à la bibliothèque Java. Le composant est automatiquement fourni dans le Studio avec deux DLL pour les systèmes d'exploitation de 32 et 64 bits.
Named-pipe name	Spécifiez un nom pour le tube nommé à utiliser. Vérifiez que le nom saisi est valide.

Advanced settings

Additional JDBC Parameters	Spécifiez des paramètres JDBC supplémentaires pour la connexion à la base de données créée.
Use existing control file	Cochez cette case pour fournir un fichier de contrôle à utiliser avec l'utilitaire nzload au lieu de spécifier explicitement toutes les options dans le composant. Lorsque cette case est cochée, l'option Data file ainsi que les autres options liées au nzload ne s'appliquent plus. Veuillez vous référer au manuel du nzload de Netezza pour plus d'informations concernant la création d'un fichier de contrôle. Remarque : La variable globale `NB_LINE` n'est pas supportée lors de l'utilisation d'un fichier de contrôle.
Control file	Saisissez le chemin d'accès au fichier de contrôle à utiliser, entre guillemets doubles, ou cliquez sur le bouton [...] afin de parcourir votre répertoire jusqu'au fichier de contrôle. Cette option est passée à l'utilitaire nzload via l'argument -cf.
Field separator	Caractère, chaîne de caractères ou expression régulière utilisé pour séparer les champs. Avertissement : Argument delim de l'utilitaire nzload. Si vous n'utilisez pas l'option Wrap quotes around fields, vous devez vous assurer que le séparateur n'est pas inclus dans les données insérées dans la base de données. La valeur par défaut est \t ou TAB. Pour améliorer les performances, utilisez la valeur par défaut.
Wrap quotes around fields	Cette option ne s'applique qu'aux colonnes de type String, Byte, Byte[], Char et Object. Sélectionnez soit : None : n'entourez pas les valeurs des colonnes de guillemets. Single quote : entourez les valeurs des colonnes de guillemets simples. Double quote : entourez les valeurs des colonnes de guillemets doubles. Avertissement : Si vous utilisez l'option Single quote ou Double quote, il est nécessaire d'utiliser \ en tant que Escape char.
Advanced options	Définissez les arguments nzload dans le tableau correspondant. Cliquez sur le bouton [+] autant de fois que nécessaire afin d'ajouter les arguments au tableau. Cliquez sur le champ Parameter et choisissez l'argument souhaité dans la liste, puis cliquez sur le champ Value correspondant et saisissez une valeur entre guillemets. Pour plus d'informations concernant les paramètres disponibles, consultez Paramètres.
Encoding	Sélectionnez l'encodage à partir de la liste.
Specify nzload path	Cochez cette case afin de spécifier le chemin d'accès complet à l'exécutable nzload. Vous devez cocher cette case si le chemin d'accès n'est pas spécifié dans la variable d'environnement PATH.
Full path to nzload executable	Chemin d'accès complet à l'exécutable nzload sur la machine en cours d'utilisation. Il est recommandé de spécifier le chemin d'accès dans la variable d'environnement PATH au lieu de sélectionner cette option.
tStatCatcher Statistics	Cochez cette case afin de collecter les données de log au niveau du composant.
Enable parallel execution	Cocher cette case permet de traiter plusieurs flux de données simultanément. Notez que cette fonctionnalité dépend de la capacité de la base de données ou de l'application à gérer plusieurs insertions en parallèle ainsi que le nombre de processeurs utilisés. Dans le champ Number of parallel executions, vous pouvez : Saisir le nombre d'exécutions parallèles désirées. Appuyer sur Ctrl+Espace et sélectionner la variable de contexte dans la liste. Pour plus d'informations, consultez le Guide d'utilisation de Studio Talend. Notez que lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-Job. Avertissement : Le champ Action on table n'est pas disponible avec la fonction de parallélisation. Ainsi, pour créer une table, vous devez utiliser un composant tCreateTable. Lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-Job.

Variables globales

Variables globales	NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier. ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. Une variable Flow fonctionne durant l'exécution d'un composant. Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser. Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend.

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend.

Utilisation

Règle d'utilisation	Ce composant est principalement utilisé lorsque des transformations particulières ne sont pas requises sur les données à charger dans la base de données. Ce composant peut être utilisé en standalone ou en tant que composant de sortie.

Règle d'utilisation

Ce composant est principalement utilisé lorsque des transformations particulières ne sont pas requises sur les données à charger dans la base de données.

Ce composant peut être utilisé en standalone ou en tant que composant de sortie.

Paramètres

Le tableau suivant liste les paramètres utilisables dans la table Advanced options, dans l'onglet Advanced settings.

-If	Nom du fichier de log à générer. Les logs seront ajoutés à la suite du fichier de log, s'il existe déjà. Si le paramètre n'est pas spécifié, le nom par défaut du fichier de log est '<table_name>.<db_name>.nzlog'. Il est généré dans le répertoire de travail courant dans lequel le Job est exécuté.
-bf	Nom du fichier de mauvais enregistrements à générer. Le fichier de mauvais enregistrements contient tous les enregistrements ne pouvant être chargés, à cause d'une erreur interne Netezza. Les enregistrements seront ajoutés à la suite si le fichier de mauvais enregistrements existe déjà. Si le paramètre n'est pas spécifié, le nom par défaut du fichier de mauvais enregistrements est '<table_name>.<db_name>.nzbad'. Il est généré dans le répertoire de travail courant dans lequel le Job est exécuté.
- ouputDir	Chemin d'accès au répertoire dans lequel les fichiers de log et de mauvais enregistrements sont générés. Si le paramètre n'est pas spécifié, les fichiers seront générés sous le répertoire courant dans lequel le Job est exécuté.
- logFileSize	Taille maximale du fichier de log. La valeur est en Mo. La valeur par défaut est de 2000 ou 2 Go. Pour économiser de l'espace disque, spécifiez un petite valeur si votre Job est souvent exécuté.
- compress	Sélectionnez cette option si le fichier de données est compressée. Les valeurs valides sont "`TRUE`" ou "`FALSE`". Valeur par défaut si "`FALSE`". Cette option n'est valide que si ce composant est utilisé par lui-même et non connecté à un autre composant via un flux d'entrée.
- skipRows <n>	Nombre de lignes à ignorer au début du fichier de données. Paramétrez la valeur à "1" si vous souhaitez ignorer la ligne d'en-tête du fichier d'entrée. La valeur par défaut est "0". Cette option ne doit être sélectionnée que si le composant est utilisé par lui-même et non connecté à un autre composant via un flux d'entrée.
- maxRows <n>	Nombre de lignes à charger à partir du fichier d'entrée. Cette option ne doit être sélectionnée que si le composant est utilisé par lui-même et non connecté à un autre composant via un flux d'entrée.
- maxErrors	Nombre maximal d'enregistrements d'erreurs à autoriser avant de terminer le processus de chargement. La valeur par défaut est "1".
-ignoreZero	Les zéros contenus dans une source binaire généreront des erreurs. Paramétrez cette option à "NO" pour générer des erreurs ou à "YES" pour ignorer les bits ayant la valeur zéro. La valeur par défaut est "NO".
- requireQuotes	Cette option nécessite que toutes les valeurs soient entourées de guillemets. La valeur par défaut est "FALSE". Cette option ne fonctionne pas avec un flux d'entrée pour le moment. Utilisez cette option uniquement en mode standalone avec un fichier existant.
- nullValue <token>	Spécifiez le jeton pour indiquer une valeur null dans le fichier de données. La valeur par défaut est "NULL". Afin d'améliorer légèrement les performances, vous pouvez configurer cette valeur comme un champ vide en spécifiant la valeur entre guillemets simples : "\'\".
- fillRecord	Traite les derniers champs d'entrée manquants comme des null. Vous n'avez pas besoin de spécifier de valeur pour cette option dans le champ du tableau. Cette option n'est pas activée par défaut, les champs d'entrée devront donc correspondre exactement à toutes les colonnes de la table par défaut. Les derniers champs d'entrée doivent être nullables dans la base de données.
- ctrlChar	Accepte les caractères de contrôle dans les champs char/varchar (vous devrez échapper les caractères NUL, CR et LF). Vous n'avez pas besoin de spécifier de valeur pour cette option dans le champ du tableau. Cette option est désactivée par défaut.
- ctInString	Accepte le caractère CR non échappé dans des champs char/varchar (LF devient une fin de ligne). Vous n'avez pas besoin de spécifier de valeur pour cette option dans le champ du tableau. Cette option est désactivée par défaut.
- truncString	Tronque toute valeur de chaîne de caractères qui dépasse sa valeur déclarée de stockage char/varchar. Vous n'avez pas besoin de spécifier de valeur pour cette option dans le champ du tableau. Cette option est désactivée par défaut.
- dateStyle	Spécifiez le format de la date des données d'entrée. Les valeurs valides sont : "YMD", "Y2MD", "DMY", "DMY2", "MDY", "MDY2", "MONDY", "MONDY2". La valeur par défaut est "YMD". Le format de date dans la colonne du schéma du composant doit correspondre à la valeur spécifiée ici. Par exemple, si vous souhaitez charger une colonne DATE, spécifiez ainsi le format de date dans le schéma du composant : "yyyy-MM-dd" et paramétrez l'option -dateStyle à "YMD". Pour une description plus précise du chargement de champs de dates et de temps, consultez Charger des colonnes de type DATE, TIME et TIMESTAMP.
-dateDelim	Caractère séparateur entre les parties d'une date. La valeur par défaut est "-" pour tous les styles de date, sauf pour"MONDY[2]" pour lequel elle est " " (espace vide). Le format de date dans la colonne du schéma du composant doit correspondre à la valeur spécifiée ici.
- y2Base	Première année exprimable via l'utilisation du style de date à deux chiffres (Y2).
- timeStyle	Spécifiez le format du temps dans les données d'entrée. Les valeurs valides sont : "24HOUR" et "12HOUR". La valeur par défaut est "24HOUR". Pour améliorer légèrement les performances, gardez la valeur par défaut. Le format de temps dans la colonne du schéma du composant doit correspondre à la valeur spécifiée ici. Par exemple, si vous souhaitez charger une colonne de type TIME, configurez le format de date dans le schéma du composant à "HH:mm:ss" et l'option -timeStyle à "24HOUR". Pour une description plus précise du chargement de champs de dates et de temps, consultez Charger des colonnes de type DATE, TIME et TIMESTAMP.
-timeDelim	Caractère séparateur des parties d'une donnée de temps. La valeur par défaut est ":". Remarque : Le format de temps dans la colonne du schéma du composant doit correspondre à la valeur spécifiée ici.
-timeRoundNanos	Autorise mais arrondit les nombres différents de zéro plus petits qu'une microseconde.
- boolStyle	Spécifiez le format dans lequel les données de type Boolean sont écrites dans les données. Les valeurs valides sont : "1_0", "T_F", "Y_N", "TRUE_FALSE", "YES". La valeur par défaut est "1_0". Pour améliorer légèrement les performances, gardez la valeur par défaut.
- allowRelay	Permet de continuer le chargement malgré une ou plusieurs réinitialisation(s) ou échec(s) des SPU (Snippet Processing Unit). Par défaut, ce comportement n'est pas autorisé.
- allowRelay <n>	Spécifiez le nombre de continuations du chargement autorisé. La valeur par défaut est "1".

Charger des colonnes de type DATE, TIME et TIMESTAMP

Lorsque ce composant est utilisé avec un flux d'entrée, le format de date spécifié dans le schéma du composant doit correspondre à la valeur spécifiée pour les options -dateStyle, -dateDelim, -timeStyle, et -timeDelim.

Type de BdD	Format de date dans le schéma	- dateStyle	- dateDelim	-timeStyle	-timeDelim
DATE	"yyyy-MM-dd"	"YMD"	"-"	n/a	n/a
TIME	"HH:mm:ss"	n/a	n/a	"24HOUR"	":"
TIMESTAMP	"yyyy-MM-dd HH:mm:ss"	"YMD"	"-"	"24HOUR"	":"