Extraire les données de modification - 7.3

Change Data Capture

author
Talend Documentation Team
EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Change Data Capture
Gouvernance de données > Systèmes tiers > Composants Database > Change Data Capture
Qualité et préparation de données > Systèmes tiers > Composants Database > Change Data Capture
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Après avoir mis en place l'environnement CDC, vous pouvez créer un Job utilisant le composant MySQL CDC pour extraire les modifications apportées aux données de la table Leadfact de façon incrémentale. Pour cela :

Procédure

  1. De la Palette, déposez les composants tMysqlCDC et tLogRow dans l'espace de modélisation graphique.
  2. Reliez ces deux composants à l'aide d'une connexion de type Row Main.
  3. Double-cliquez sur le composant tMysqlCDC pour paramétrer ses propriétés.
  4. Dans le champ Property Type, sélectionnez l'option Repository, puis sélectionnez le schéma correspondant à la table de base de données MySQL, CDC_connection dans cet exemple. Les informations de connexion seront renseignées automatiquement.
    Remarque :

    Si vous n'avez pas stocké les informations de connexion au data warehouse CRM dans le Metadata, sélectionnez Built-in dans le champ Property Type et renseignez les champs manuellement.

  5. Dans le champ Schema using CDC, sélectionnez l'option Repository, puis le schéma de votre table Leadfact stockée dans les métadonnées (Metadata).
  6. Dans le champ Table using CDC, renseignez le nom de la table capturée par le CDC, Leadfact dans ce scénario.
  7. Dans le champ Subscriber, renseignez le nom du souscripteur qui va extraire les données modifiées : Sub_Mktg pour le service Marketing, Sub_Sales pour le service Ventes ou Sub_Finance pour le service Finance.
  8. Dans le champ Events to catch, cochez les cases correspondant au type de modifications que le souscripteur va extraire. Ici cochez les trois cases pour les trois souscripteurs.
  9. Double-cliquez sur le composant tLogRow pour paramétrer ses propriétés.
  10. Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.
  11. Enregistrez votre Job et appuyez sur F6 pour l'exécuter.

Résultats

Le nom des clients est donc mis en majuscule et le type de modification apparaît ici sous la forme d'un U pour Update.

Une fois, ces modifications extraites, elles ne sont plus disponibles dans la table des modifications. Pour vérifier leur extraction, cliquez-droit sur la table Leadfact surveillée par le CDC et sélectionnez l'option Views All Changes. Les modifications extraites n'y apparaissent plus.