Propriétés du tJDBCSCDELT Standard - 7.3

SCDELT

author
Talend Documentation Team
EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Business Intelligence > Composants SCDELT
Gouvernance de données > Systèmes tiers > Composants Business Intelligence > Composants SCDELT
Qualité et préparation de données > Systèmes tiers > Composants Business Intelligence > Composants SCDELT
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tJDBCSCDELT s'exécutant dans le framework de Jobs Standard.

Le composant Standard tJDBCSCDELT appartient à deux familles : Business Intelligence et Bases de données.

Le composant de ce framework est disponible dans tous les produits Talend.

Paramètres simples

Property Type

Sélectionnez la manière de configurer les informations de connexion.

  • Built-In : les paramètres de connexion seront définis localement pour ce composant. Vous devez spécifier manuellement les valeurs pour toutes les propriétés de connexion.

  • Repository : les paramètres de connexion stockés centralement dans le Repository > Metadata seront réutilisés par ce composant. Vous devez cliquer sur le bouton [...] et, dans la boîte de dialogue Repository Content, sélectionnez les détails de connexion à réutiliser. Toutes les propriétés de connexion seront automatiquement renseignées.

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

JDBC URL

URL JDBC de la base de données à utiliser. Par exemple, l'URL JDBC de la base de données Amazon Redshift est jdbc:redshift://endpoint:port/database.

Driver JAR

Renseignez cette table pour charger les pilotes Jar requis. Pour ce faire, cliquez sur le bouton [+], sous la table, pour ajouter autant de lignes que nécessaire, chaque ligne pour un Jar de pilote. Sélectionnez la cellule et cliquez sur le bouton [...] à droite de la cellule pour ouvrir la boîte de dialogue Module, dans laquelle vous pouvez sélectionner le Jar du pilote à utiliser. Par exemple, le pilote Jar RedshiftJDBC41-1.1.13.1013.jar pour la base de données Redshift.

Pour plus d'informations, consultez Importer un pilote de base de données.

Driver Class

Saisissez entre guillemets doubles le nom de la classe pour le pilote spécifié. Par exemple, pour le pilote RedshiftJDBC41-1.1.13.1013.jar, le nom à saisir est com.amazon.redshift.jdbc41.Driver.

Username et Password

Données d'authentification de l'utilisateur de la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

DB Schema

Spécifiez le nom du schéma de la base de données. Pour les bases de données ne supportant pas les schémas, laissez le champ vide.

Source table

Spécifiez le nom de la table source d'entrée dont les modifications sur les données seront capturées par le SCD.

Table

Spécifiez le nom de la table de dimension dans laquelle les données capturées par le SCD seront écrites.

Action on table

Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :

  • None : n'effectuer aucune opération de table.

  • Drop and create table : la table est supprimée et de nouveau créée.

  • Create table : la table n'existe pas et est créée.

  • Create table if does not exist : créer la table si elle n'existe pas encore.

  • Drop table if exists and create : supprimer la table si elle existe déjà, puis en créer une nouvelle.

  • Clear table : le contenu de la table est supprimé. Vous pouvez annuler cette opération.

  • Truncate table : le contenu de la table est supprimé. Vous ne pouvez pas annuler l'opération (rollback).

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema.
Remarque : Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.
  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Surrogate key

Définissez la colonne dans laquelle la clé de substitution sera stockée. Une clé de substitution peut être générée à partir de la méthode sélectionnée dans la liste Creation.

Creation

Sélectionnez l'une des méthodes suivantes pour générer la clé de substitution.

  • Auto increment : un entier s'incrémentant automatiquement sera utilisé.

  • DB sequence : une séquence sera utilisée.

Source keys

Spécifiez une ou plusieurs colonnes utilisées comme clés assurant l'unicité des données entrantes.

Use SCD type 0 fields

Cochez cette case et, dans la table SCD type 0 fields, spécifiez les colonnes dont les valeurs modifiées seront suivies à l'aide du Type 0 de SCD.

Cette option supporte uniquement ces bases de données : Exasol, MySQL, MSSql, Oracle, Postgresql et Snowflake.

Remarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-07 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.

Use SCD type 1 fields

Cochez cette case et, dans la table SCD type 1 fields, spécifiez les colonnes dont les valeurs modifiées seront suivies à l'aide du Type 1 de SCD.

SCD type 1 fields

Cliquez sur le bouton [+] pour ajouter autant de lignes que nécessaire, chaque ligne pour une colonne. Cliquez sur le côté droit de la cellule et dans la liste déroulante, sélectionnez la colonne dont les valeurs modifiées seront suivies à l'aide du Type 1 de SCD.

Use SCD type 2 fields

Cochez cette case et, dans la table SCD type 2 fields, spécifiez les colonnes dont les valeurs modifiées seront suivies à l'aide du Type 2 de SCD.

SCD type 2 fields

Cliquez sur le bouton [+] pour ajouter autant de lignes que nécessaire, à raison d'une ligne pour une colonne. Cliquez sur la flèche sur le côté droit de la cellule et, dans la liste déroulante, sélectionnez la colonne dont les valeurs modifiées seront suivies à l'aide du Type 2 de SCD.

Cette table est seulement disponible si l'option Use SCD type 2 fields est sélectionnée.

Start date

Spécifiez la colonne contenant la date de départ pour le Type 2 de SCD.

Cette liste est disponible seulement si l'option Use SCD type 2 fields est sélectionnée.

End date

Spécifiez la colonne contenant la date de fin pour le Type 2 de SCD.

Cette liste est disponible seulement si l'option Use SCD type 2 fields est sélectionnée.

Remarque : Pour éviter des enregistrements de modifications en double, il est recommandé de sélectionner une colonne qui peut identifier chaque modification pour ce champ.
 

End Date Field Type : spécifiez la valeur de date de fin, pouvant être NULL ou Fixed Date.

  • NULL : insère la chaîne de caractères NULL dans la colonne ;
  • Fixed Date : insère une valeur de date spécifique dans la colonne. Vous pouvez configurer la date dans le cadre à droite. La date doit respecter le format présent dans le cadre, yyyy-MM-dd.

Log active status

Cochez cette case et, dans la liste déroulante Active field qui s'affiche, sélectionnez la colonne contenant la valeur de statut true ou false, ce qui permet d'indiquer l'enregistrement actif pour le Type 2 de SCD.

Cette option est seulement disponible si l'option Use SCD type 2 fields est sélectionnée.

Log versions

Cochez cette case et, dans la liste déroulante Version field qui s'affiche, sélectionnez la colonne contenant le numéro de version pour l'enregistrement pour le Type 2 de SCD.

Cette option est seulement disponible si l'option Use SCD type 2 fields est sélectionnée.

Mapping

Sélectionnez le fichier de mapping des métadonnées pour la base de données à utiliser. Ce fichier est utilisé pour la conversion de type des données entre la base de données et Java. Pour plus d'informations concernant le mapping de métadonnées, consultez la documentation relative au Mapping de types.
Remarque : Vous pouvez utiliser le mapping Hive pour supporter Databricks Delta Lake.

Advanced settings

Source fields value include Null

Cochez cette case pour permettre aux colonnes source de contenir des valeurs nulles. Les colonnes source font référence ici aux champs définis dans les tables SCD type 1 fields et SCD type 2 fields.

Debug mode

Cochez cette case pour afficher chaque étape durant le traitement des données dans une base de données.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

ERROR_MESSAGE

Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères.

Utilisation

Règle d'utilisation

Ce composant peut être utilisé en standalone dans un Job ou un sous-job.