Propriétés du tTeradataTPTUtility Standard - 7.2

Teradata

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Database > Composants Teradata
Gouvernance de données > Systèmes tiers > Composants Database > Composants Teradata
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Teradata

Ces propriétés sont utilisées pour configurer le tTeradataTPTUtility s'exécutant dans le framework de Jobs Standard.

Le composant tTeradataTPTUtility Standard appartient à la famille Bases de données.

Le composant de ce framework est disponible dans tous les produits Talend.

Basic settings Data file

Property Type

Peut être Built-In ou Repository.

Built-in : Propriétés utilisées ponctuellement.

Repository : sélectionnez le référentiel dans lequel sont stockées les propriétés. Le champ Filename est alors rempli automatiquement à l'aide des données récupérées.

Filename

Spécifiez le fichier dans lequel sauvegarder vos données de sortie.

Écrire à la suite

Cochez cette case pour ajouter les données entrantes dans le fichier défini dans le champ Filename.

Property Type

Peut être Built-In ou Repository.

Built-in : Propriétés utilisées ponctuellement.

Repository : sélectionnez le référentiel dans lequel sont stockées les propriétés. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

Plateforme d'exécution

Sélectionnez le type de système d'exploitation utilisé pour exécuter le Job, Windows ou Unix.

TDPID

Spécifiez le Director program identifier de Teradata. Cela peut-être le nom ou l'adresse IP de la base de données Teradata à laquelle vous accédez.

Database name

Saisissez dans ce champ le nom de la base de données Teradata.

Username et Password

Spécifiez l'identifiant et mot de passe de l'utilisateur ou de l'utilisatrice de la base de données Teradata.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Remarque :

Il est recommandé de ne pas utiliser le mot-clé Teradata Database comme nom de colonne de base de données (Db Column). Si vous y êtes obligé(e), le nom de la colonne de base de données doit alors être entouré par \". Par exemple, lorsque le mot-clé id est utilisé comme nom de colonne d'une base de données, le champ Db Column doit être renseigné par \"id\".

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Consumer Operator

Sélectionnez un opérateur dans la liste déroulante.

  • Load : écrit des données dans une table Teradata vide à l'aide du protocole Teradata FastLoad utility.

  • Inserter : insère les données dans des tables Teradata avec des sessions SQL.

  • Update : réalise des opérations Insert, Update ou Delete à l'aide du protocole Teradata MultiLoad utility.

  • Stream : charge des données en continu dans des tables Teradata à l'aide de l'utilitaire Teradata TPump.

Pour plus d'informations concernant cet opérateur, consultez Teradata consumer operators(en anglais).

Action sur les données

Sélectionnez dans la liste déroulante une action à effectuer sur les données.
  • Insert : ajouter de nouveaux enregistrements à la table. Si des doublons sont trouvés, le Job s'arrête.

  • Update : mettre à jour des enregistrements existants dans la table.

  • InsertOrUpdate : insère de nouveaux enregistrements ou mettre à jour les enregistrements existants en se basant sur la clé de référence donnée.

  • Delete : supprimer des enregistrements correspondant au flux d'entrée.

Remarque :

Vous devez spécifier au moins une colonne comme clé primaire sur laquelle baser l'opération Update ou Delete. Cliquez sur le bouton [...] à côté du champ Edit schema et en cochant la case de la (des) colonne(s) à définir comme clé(s) primaire(s).

Ce champ apparaît uniquement lorsque l'opérateur Update ou Stream est sélectionné dans la liste déroulante Consumer Operator.

Producer Operator

Sélectionnez un opérateur dans la liste déroulante. Seul l'opérateur DataConnector est actuellement supporté.

DataConnector : accède aux fichiers directement ou via un module d'accès, puis les écrit dans le flux de données.

Pour plus d'informations concernant cet opérateur, consultez Teradata consumer operators(en anglais).

Table

Spécifiez le nom de la table à écrire dans la base de données Teradata. Notez que seule une table peut être écrite à la fois.

Dossier pour les scripts générés

Spécifiez le répertoire sous lequel le fichier script Teradata Parallel Transporter sera créé durant l'exécution du Job puis supprimé avant la fin du Job. Le fichier script sera supprimé à la fin de l'exécution du Job.

Fichier d'erreur

Spécifiez le fichier dans lequel les messages de log seront enregistrés.

Advanced settings

Row Separator

Caractère, chaîne ou expression régulière séparant les lignes.

Field separator

Caractère, chaîne de caractères, ou expression régulière à utiliser pour séparer les champs.

Inclure l'en-tête

Cochez cette case pour inclure l'en-tête des colonnes dans le fichier.

Encoding

Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données de base de données.

Configurer les paramètres de script

Cochez cette case pour spécifier la valeur des paramètres du script, qui seront utilisés lors de la génération d'un script durant l'exécution du Job. Si vous ne les spécifiez pas manuellement, le système utilisera leurs valeurs par défaut.

Charger l'opérateur

Spécifiez l'opérateur de chargement.

Ce champ apparaît uniquement lorsque la case Set Script Parameters est cochée.

Connecteur de données

Spécifiez le connecteur de données.

Ce champ apparaît uniquement lorsque la case Set Script Parameters est cochée.

Job Name

Spécifiez le nom du Job TPT (Teradata Parallel Transporter) défini via la commande Teradata tbuild.

Pour plus d'informations concernant la commande tbuild, consultez tbuild (en anglais).

Ce champ apparaît uniquement lorsque la case Set Script Parameters est cochée.

Layout Name (schema)

Spécifiez un schéma pour le chargement des données.

Ce champ apparaît uniquement lorsque la case Set Script Parameters est cochée.

Définir la table des logs

Cochez cette case pour spécifier le nom de table de log, afin que les messages de log enregistrés dans le fichier de log soient écrits dans la table de log.

Cette option est disponible lorsque l'option Inserter n'est pas sélectionnée dans la liste déroulante Consumer Operator dans la vue Basic settings.

Return mload error

Cochez cette case pour spécifier le code de retour à partir duquel retourner une erreur dans la console.

Définir l'ensemble de caractères

Cochez cette case pour spécifier l'encodage des caractères à utiliser dans votre système.

Apply TPT consumer operator optional attributes

Cochez cette case afin de définir les attributs facultatifs pour l'opérateur du consommateur sélectionné.

Pour plus d'informations concernant les attributs facultatifs de chaque opérateur de consommateur, consultez Teradata Parallel Transporter Reference.

Attributs facultatifs

Cliquez sur le bouton [+] sous la table pour ajouter autant des lignes que nécessaire pour chaque attribut facultatif. Configurez les paramètres comme suit pour chaque attribut :

  • Name : cliquez dans la cellule et sélectionnez un attribut facultatif dans la liste déroulante. La liste des attributs facultatifs varie selon l'opérateur du consommateur sélectionné. Pour plus d'informations concernant les attributs facultatifs pour chaque opérateur du consommateur, consultez Attributs facultatifs supportés pour chaque opérateur de consommateur.

  • Value : saisissez la valeur de l'attribut facultatif correspondant.

Pour plus d'informations concernant la définition de la valeur d'un attribut, consultez Teradata Parallel Transporter Reference (en anglais).

Cette table apparaît uniquement lorsque la case Apply TPT consumer operator optional attributes est cochée.

tStatCatcher Statistics

Cochez cette case afin de collecter les données de log au niveau des composants.

Variables globales

Variables globales

EXIT_VALUE : code de sortie du processus. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend.

Utilisation

Règle d'utilisation

Précédé par un composant d'entrée, le tTeradataTPTUtility écrit les données entrantes dans un fichier, puis les charge du fichier dans la base de données Teradata. Ce traitement se fait avec de hautes performances. Pour plus d'informations concernant l'utilisation de ce composant, consultez tbuild (en anglais).

Limitation

Il est nécessaire d'installer l'outil de client Teradata avec les fonctionnalités Teradata Parallel Transporter Base et Teradata Parallel Transporter Stream sur la machine où les Jobs utilisant ce composant sont exécutés.