Propriétés du tMSSqlCDC Standard - 7.3

Change Data Capture

author
Talend Documentation Team
EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Change Data Capture
Gouvernance de données > Systèmes tiers > Composants Database > Change Data Capture
Qualité et préparation de données > Systèmes tiers > Composants Database > Change Data Capture
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tMSSqlCDC s'exécutant dans le framework de Jobs Standard.

Le composant tMSSqlCDC Standard appartient à la famille Bases de données.

Le composant de ce framework est disponible dans tous les produits Talend nécessitant une souscription.

Remarque : Ce composant est une version spécifique d'un connecteur à une base de données dynamique. Les propriétés associées aux paramètres de la base de données dépendent du type de base de données sélectionné. Pour plus d'informations concernant les connecteurs aux bases de données, consultez Utiliser des composants de bases de données dynamiques.

Paramètres simples

Database

Sélectionnez un type de base de données dans la liste et cliquez sur Apply.

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

Remarque : Notez que lorsqu'un Job contient un Job parent et un Job enfant, si vous devez partager une connexion existante entre ces deux niveaux, par exemple pour partager la connexion créée par le Job parent au Job enfant, vous devez :
  1. au niveau du Job parent, enregistrer la connexion à la base de données à partager dans la vue Basic settings du composant de connexion créant cette connexion à la base de données.

  2. au niveau du Job enfant, utiliser un composant de connexion dédié afin de lire cette connexion enregistrée.

Pour un exemple de partage d'une connexion à une base de données à travers différents niveaux de Jobs, consultez le Guide d'utilisation du Studio Talend .

Property type

Peut être Built-in ou Repository.

  • Built-In : propriétés utilisées ponctuellement.
  • Repository : sélectionnez le référentiel dans lequel sont stockées les propriétés. Les champs suivants sont automatiquement renseignés à l'aide des données récupérées.
Avertissement :

Réinitialisez le type de base de données en cliquant sur le bouton adéquat afin de sélectionner la connexion CDC.

JDBC Provider

Sélectionnez le fournisseur du pilote JDBC à utiliser, Microsoft (recommandé, par défaut) ou Open source JTDS.

Notez que, quand Microsoft est sélectionné, vous devez télécharger le pilote Microsoft JDBC pour les serveurs SQL sur le Centre de téléchargement de Microsoft. Vous devez ensuite décompresser le fichier zip téléchargé, choisir un fichier .jar dans le dossier décompressé, selon votre version de JRE, renommer le fichier .jar en mssql-jdbc.jar et l'installer manuellement. Pour plus d'informations relatives au choix du fichier .jar, consultez la configuration système requise sur le Centre de téléchargement Microsoft.

Lorsque vous utilisez ce composant avec la source de données dans Talend Runtime, vous devez utiliser le pilote Open source JTDS.

Remarque : La valeur par défaut de cette option est Microsoft uniquement si vous avez installé la mise à jour mensuelle R2020-06 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.

Host

Adresse IP du serveur de base de données.

Port

Numéro du port d'écoute du serveur de base de données.

Database

Saisissez le nom de la base de données.

Schema

Nom du schéma.

Username et Password

Données d'authentification de l’utilisateur ou l'utilisatrice de la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Schema using CDC et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champ qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in), soit distant dans le Repository.

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Avertissement :

Réinitialisez le type de base de données en cliquant sur le bouton adéquat afin de sélectionner la connexion CDC.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Table Name

Sélectionnez la table source dans laquelle capturer les changements apportés aux données.

Subscriber

Saisissez le nom du souscripteur ayant accès à la table de modifications.

Events to catch

Insert : cochez cette case pour capturer les données insérées dans la table de modifications depuis la dernière extraction.

Update : cochez cette case pour capturer les données mises à jour dans la table de modifications depuis la dernière extraction.

Delete : cochez cette case pour capturer les données supprimées dans la table de modifications depuis la dernière extraction.

Limit

Nombre maximum de lignes pouvant être consommées par un souscripteur dans la table de modifications.

Advanced settings

Additional JDBC parameters

Spécifiez des paramètres de connexion supplémentaires pour la connexion à la base de données en cours de création. Cette option n'est pas disponible lorsque vous cochez la case Use an existing connection dans la vue Basic settings.

Keep data in CDC Table Cochez cette case pour garder les changements à disposition d'un ou plusieurs système(s) cible même après qu'ils ont été consultés.

Trim all the String/Char columns

Cochez cette case pour supprimer les espaces en début et en fin de champ dans toutes les colonnes contenant des chaînes de caractères.

Trim columns

Supprimez les espaces blancs en début et fin de champ dans les colonnes sélectionnées.

Remarque :

Décochez la case Trim all the String/Char columns pour activer ce champ.

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Enable parallel execution
Cocher cette case permet de traiter plusieurs flux de données simultanément. Notez que cette fonctionnalité dépend de la capacité de la base de données ou de l'application à gérer plusieurs insertions en parallèle ainsi que le nombre de processeurs utilisés. Dans le champ Number of parallel executions, vous pouvez :
  • Saisir le nombre d'exécutions parallèles désirées.
  • Appuyer sur les touches Ctrl +Espace et sélectionner la variable de contexte appropriée dans la liste. Pour plus d'informations, consultez le Guide utilisateur de Studio Talend.

Notez que, lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour récupérer les valeurs de retour dans un sous-Job.

  • Le champ Action on table n'est pas disponible avec la fonction de parallélisation. Ainsi, pour créer une table, vous devez utiliser un composant tCreateTable.
  • Lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-Job.

Variables globales

Global Variables

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend .

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé comme composant de début. Il nécessite un composant de sortie et une connexion de type Row Main.