tAS400CDC - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tAS400CDC

Famille du composant

Databases/AS/400

 

Fonction

Le composant tAS400CDC extrait les données d'un système source qui ont été modifiées depuis la dernière extraction et transfère ces données vers un ou plusieurs autre(s) système(s). Par défaut, ce composant appelle automatiquement le programme dédié AS/400, RUNCDC, pour écrire les dernières informations de mise à jour dans une table de modifications (une table CDC) et exécuter des requêtes dans la même table afin de lire les modifications.

<Studio_install>\plugins\org.talend.designer.cdc_<version>\resource\fitcdc.savf

Pour plus d'informations concernant ce script fitcdc.savf et la commande utilisée pour installer le programme RUNCDC, consultez la section décrivant comment configurer le CDC en mode Redo/Archive log (journal) pour AS/400 dans le Guide utilisateur du Studio Talend.

Objectif

Le tAS400CDC permet l'extraction et la migration de données. Le tAS400CDC extrait uniquement les changements apportés aux données source et les met à disposition de(s) système(s) cible(s) utilisant l'aperçu de base de données CDC.

Basic settings

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat à partir de la liste Component List pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

Note

Lorsqu'un Job contient un Job parent et un Job enfant, si vous souhaitez utiliser une connexion existant entre les deux niveaux, par exemple pour partager la connexion créée par le Job parent avec le Job enfant, vous devez :

  1. Au niveau parent, enregistrer la connexion à la base de données à partager, dans la vue Basic settings du composant de connexion créant cette connexion.

  2. Au niveau enfant, utiliser un composant dédié à la création de connexion, afin de lire la connexion enregistrée.

Pour plus d'informations concernant le partage d'une connexion à travers différents niveaux de Jobs, consultez le Guide utilisateur du Studio Talend.

 

Property type

Peut-être Built-in ou Repository.

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier de propriétés du composant dans le Repository. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

Avertissement

Réinitialisez le type de base de données en cliquant sur le bouton adéquat afin de sélectionner la connexion CDC.

 

DB Version

Sélectionnez la version d'AS/400 que vous utilisez.

 

Host name

Adresse IP du serveur de base de données.

 

Database

Nom de la base de données CDC.

Note

La base de données CDC contenant les données modifiées doit être différente de celle contenant les données source.

 

Username et Password

Informations d'authentification sur l'utilisateur de base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles, puis cliquez sur OK afin de sauvegarder les paramètres.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

 

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Avertissement

Réinitialisez le type de base de données en cliquant sur le bouton adéquat afin de sélectionner la connexion CDC.

  

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

Table Name

Nom (court) de la table source dans laquelle capturer les changements apportés aux données. La table CDC cible utilise automatiquement ce nom court pour se nommer elle-même.

 

Source Library

Nom de la bibliothèque source de la base de données AS/400.

Note

Le nom de la bibliothèque ne doit pas présenter plus de 10 caractères, et il correspond généralement au nom de la base de données.

 

Subscriber

Saisissez le nom de l'application qui utilisera la table de modifications.

 

Events to catch

Insert : Cochez cette case pour capturer les données insérées dans la table de modifications depuis la dernière extraction.

Update : Cochez cette case pour capturer les données mises à jour dans la table de modifications depuis la dernière extraction.

Delete : Cochez cette case pour capturer les données supprimées dans la table de modifications depuis la dernière extraction.

  Member

Saisissez le nom du membre contenant les enregistrements souhaités. Un membre est une partie d'un fichier physique dans la bibliothèque et contient un groupe d'entrées. Pour plus d'informations, recherchez format of an AS/400 file sur le site http://www.ibm.com.

Advanced settings

Additional JDBC parameters

Ajoutez des informations de connexion supplémentaires nécessaires à la connexion à la base de données. Cette option est indisponible si vous cochez la case Use an existing connection dans la vue Basic settings.

 

Keep data in CDC Table

Cochez cette case pour garder les changements à disposition d'un ou plusieurs système(s) cible même après qu'ils aient été consultés.

 

Trim all the String/Char columns

Cochez cette case pour supprimer les espaces en début et en fin de champ dans toutes les colonnes contenant des chaînes de caractères.

 

Trim column

Supprimez les espaces en début et en fin de champ dans les colonnes sélectionnées.

Note

Décochez Trim all the String/Char columns pour activer le tableau Trim column.

 

Disable command

Cochez cette case afin de pouvoir appeler manuellement le programme RUNCDC manuellement pour écrire les modifications dans la table CDC.

 

Customize command

Cochez cette case pour écrire les commandes personnalisées écrasant les commandes par défaut utilisées par le tAS400CDC.

Par exemple, le tAS400CDC exécute par défaut la commande suivante :

<CDC_library_name>/RUNCDC FILE(<Source_library_name>/<Source_table_name>) LIBOUT(<CDC_library_name>) MODE(*DETACHED) MBROPT(*ADD)

Cette commande ne détache pas automatiquement de récepteur de son journal correspondant et ne peut créer et attacher un nouveau récepteur à ce journal. Dans ce cas, vous pouvez saisir votre commande personnalisée comme suit afin d'automatiser les processus de détachement et d'attachement :

<CDC_library_name>/RUNCDC FILE(<Source_library_name>/<Source_table_name>) LIBOUT(<CDC_library_name>) MODE(*DETACHED) MBROPT(*ADD) DTCHJRN(*YES)

Notez que le nom de la bibliothèque CDC est souvent le nom de la base de données CDC.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Utilisation

Ce composant est généralement utilisé comme composant de début. Il nécessite un composant de sortie et une connexion de type Row > Main.

Notez que le journal et le récepteur requis par le CDC sont contrôlés par l'administrateur du système AS/400. Pour cette raison, à partir de la version 5.4.2 du studio, le tAS400CDC exécute le programme RUNCDC uniquement et ne crée pas, n'active pas, ne désactive pas, ne modifie pas et ne supprime pas automatiquement de journal ou de récepteur de ce système AS/400. Vous devez demander à l'administrateur AS/400 d'effectuer ces opérations.

Ces modifications de comportement, depuis la version 5.4.2, ne permettent plus au tAS400CDC d'exécuter la commande suivante comme dans les versions antérieures :

CHGJRN JRN(<Source_library_name>/<Source_table_name>) JRNRCV(*GEN)

Cette commande est utilisée pour assurer qu'un ancien récepteur est détaché d'un journal et qu'un nouveau récepteur est attaché au journal afin de récupérer la dernière modification. Il est recommandé d'exécuter cette commande dans votre système AS/400 avant d'exécuter ce composant, ou de saisir, dans le champ qui apparaît lorsque la case Customize command est cochée la commande d'exemple ci-dessus, afin d'automatiser les processus d'attachement et détachement.

Pour plus d'informations concernant la gestion du CDC AS/400 par le studio depuis la version 5.4.2, consultez les sections décrivant l'architecture CDC et comment configurer le CDC en mode Redo/Archive log (journal) pour AS/400 dans le Guide utilisateur de Studio Talend.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Scénario associé

Pour un scénario associé, consultez Scénario 2 : Extraire les modifications à l'aide du CDC Redo log d'Oracle du composant tOracleCDC.