Propriétés du tMysqlCDC Standard - 7.3

Change Data Capture

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Database (Intégration) > Change Data Capture
Gouvernance de données > Systèmes tiers > Composants Database (Intégration) > Change Data Capture
Qualité et préparation de données > Systèmes tiers > Composants Database (Intégration) > Change Data Capture
Last publication date
2024-02-22

Ces propriétés sont utilisées pour configurer le tMysqlCDC s'exécutant dans le framework de Jobs Standard.

Le composant tMysqlCDC Standard appartient à la famille Bases de données.

Le composant de ce framework est disponible dans tous les produits Talend.

Remarque : Ce composant est une version spécifique d'un connecteur à une base de données dynamique. Les propriétés associées aux paramètres de la base de données dépendent du type de base de données sélectionné. Pour plus d'informations concernant les connecteurs dynamiques aux bases de données, consultez Composants de bases de données dynamiques.

Basic settings

Base de données

Sélectionnez un type de base de données dans la liste et cliquez sur Apply.

Property type

Peut être Built-in ou Repository.

 

Built-In : propriétés utilisées ponctuellement.

 

Repository : sélectionnez le référentiel dans lequel sont stockées les propriétés. Les champs suivants sont automatiquement renseignés à l'aide des données récupérées.

Avertissement :

Réinitialisez le type de base de données en cliquant sur le bouton adéquat afin de sélectionner la connexion CDC.

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

Remarque : Notez que lorsqu'un Job contient un Job parent et un Job enfant, si vous devez partager une connexion existante entre ces deux niveaux, par exemple pour partager la connexion créée par le Job parent au Job enfant, vous devez :
  1. au niveau du Job parent, enregistrer la connexion à la base de données à partager dans la vue Basic settings du composant de connexion créant cette connexion à la base de données.

  2. au niveau du Job enfant, utiliser un composant de connexion dédié afin de lire cette connexion enregistrée.

Pour un exemple de partage d'une connexion à une base de données à travers différents niveaux de Jobs, consultez le Guide d'utilisation du Studio Talend .

Host

Adresse IP du serveur de base de données.

Port

Numéro du port d'écoute du serveur de base de données.

Database

Nom de la base de données.

Username et Password

Données d'authentification de l'utilisateur ou de l'utilisatrice à la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Schema using CDC et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champ qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in), soit distant dans le Repository.

 

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Avertissement :

Réinitialisez le type de base de données en cliquant sur le bouton adéquat afin de sélectionner la connexion CDC.

 

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Table utilisant le CDC

Sélectionnez la table source dans laquelle capturer les changements apportés aux données.

Souscripteur

Saisissez le nom du souscripteur ayant accès à la table de modifications.

Événements à capturer

Insert : cochez cette case pour capturer les données insérées dans la table de modifications depuis la dernière extraction.

Update : cochez cette case pour capturer les données mises à jour dans la table de modifications depuis la dernière extraction.

Delete : cochez cette case pour capturer les données supprimées dans la table de modifications depuis la dernière extraction.

Limit

Nombre maximum de lignes pouvant être consommées par un souscripteur dans la table de modifications.

Advanced settings

Additional JDBC Parameters

Définissez des propriétés de connexion supplémentaires pour la connexion à la base de données que vous créez.

Cette option est indisponible lorsque la case Use an existing connection est cochée.

Keep data in CDC Table Cochez cette case pour garder les changements à disposition d'un ou plusieurs système(s) cible même après qu'ils ont été consultés.
Activer le résultat en mode flux Cochez cette case pour activer la mise en flux au lieu de la mise en mémoire tampon, ce qui permet au code de lire une table de données volumineuse sans consommer trop de mémoire, afin d'optimiser les performances.

Trim all the String/Char columns

Cochez cette case pour supprimer les espaces en début et en fin de champ dans toutes les colonnes contenant des chaînes de caractères.

Trim columns

Supprimez les espaces blancs en début et fin de champ dans les colonnes sélectionnées.

Remarque :

Décochez Trim all the String/Char columns pour activer le tableau Trim column.

tStatCatcher Statistics

Cochez cette case afin de collecter les données de log au niveau du composant.

Enable parallel execution
Cocher cette case permet de traiter plusieurs flux de données simultanément. Notez que cette fonctionnalité dépend de la capacité de la base de données ou de l'application à gérer plusieurs insertions en parallèle ainsi que le nombre de processeurs utilisés. Dans le champ Number of parallel executions, vous pouvez :
  • Saisir le nombre d'exécutions parallèles désirées.
  • Appuyer sur Ctrl+Espace et sélectionner la variable de contexte dans la liste. Pour plus d'informations, consultez le Guide d'utilisation de Studio Talend.

Notez que lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-Job.

  • Le champ Action on table n'est pas disponible avec la fonction de parallélisation. Ainsi, pour créer une table, vous devez utiliser un composant tCreateTable.
  • Lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-Job.

Global Variables

Global Variables

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend.

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé comme composant de début. Il nécessite un composant de sortie et une connexion de type Row Main.