Étape 3 : Extraire les modifications apportées aux données - 7.3

Change Data Capture

author
Talend Documentation Team
EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Change Data Capture
Gouvernance de données > Systèmes tiers > Composants Database > Change Data Capture
Qualité et préparation de données > Systèmes tiers > Composants Database > Change Data Capture
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Après avoir mis en place l'environnement CDC, vous pouvez créer un Job utilisant le composant Oracle CDC pour extraire les modifications apportées aux données de la table LEADFACT. Pour cela :

Procédure

  1. Dans la Palette, cliquez-déposez les composants tOracleCDC et tLogRow.
  2. Reliez ces deux composants à l'aide d'une connexion de type Row Main.
  3. Double-cliquez sur le composant tOracleCDC pour ouvrir la vue Basic settings et paramétrer ses propriétés.
  4. Dans le champ Property Type, sélectionnez l'option Repository, puis la connexion cdc_publisher à la base de données CDC. Les informations de connexion seront renseignées automatiquement.
    Remarque :

    Si vous n'avez pas stocké les informations de connexion à l'entrepôt de données dans le dossier Metadata dans l'arborescence Repository, sélectionnez Built-in dans la liste Property Type et renseignez les champs manuellement.

  5. Dans le champ Schema using CDC, sélectionnez l'option Repository, puis le schéma de votre table LEADFACT stockée dans le dossier Metadata.
  6. Dans le champ Table using CDC, renseignez le nom de la table capturée par le CDC, Leadfact dans ce scénario.
  7. Dans le champ Events to catch, cochez les cases correspondant au type de modifications que le souscripteur va extraire. Ici cochez les trois cases pour les trois souscripteurs.
  8. Double-cliquez sur le tLogRow pour afficher sa vue Basic settings et configurer ses propriétés.
  9. Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.
  10. Cliquez sur Edit schema afin d'ouvrir la boîte de dialogue du schéma.
  11. Dans la colonne Date Pattern de la ligne TALEND_CDC_CREATION_DATE, saisissez le format de date souhaité entre guillemet : "yyyy-MM-dd".
  12. Enregistrez votre Job et appuyez sur F6 pour l'exécuter.

Résultats

Dans le mode Redo log, les modifications effectuées sur les données sont indiquées de la façon suivante : des modifications équivalente à une opération "mettre à jour et supprimer" (UO), puis à une opération "mettre à jour et insérer" (UN). Ainsi, les informations sur vos clients apparaissent deux fois :

- la première fois, elles ne sont pas modifiées et portent la mention UO pour dire qu'elles ont été supprimées.

- la deuxième fois, elles apparaissent modifiées avec la mention UN pour dire qu'elles ont été insérées.

Une fois, ces modifications extraites, elles ne sont plus disponibles dans la table des modifications. Pour vérifier leur extraction, faites un clic-droit sur la table LEADFACT surveillée par le CDC et sélectionnez l'option Views All Changes. Les modifications extraites n'y apparaissent plus.

Pour un autre scénario CDC utilisant le mode Trigger, consultez Extraire les modifications à l'aide du CDC.