変更データの抽出 - Cloud - 8.0

Change Data Capture

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データガバナンス > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更

このタスクについて

CDC環境を設定した後に、Mysql CDCコンポーネントを使ってジョブをデザインし、Leadfactテーブルから変更データを増分抽出できるようになります。これを設定するには、以下のようにします:

手順

  1. [Palette] (パレット)からtMysqlCDCおよびtLogRowコンポーネントをデザインワークスペースにドロップします。
  2. [Row Main] (行メイン)リンクを使用して2つのコンポーネントをリンクします。
  3. tMysqlCDCコンポーネントをダブルクリックして、プロパティを定義します。
  4. [Property Type] (プロパティタイプ)[Repository] (リポジトリー)に設定し、このシナリオでは[CDC_connection]というMysqlデータベーステーブルに対応するスキーマを選択します。接続の詳細は、対応するフィールドに自動的に表示されます。
    注:

    CRMデータウェアハウスの接続の詳細をリポジトリーの[Metadata] (メタデータ)エントリーに保管していない場合は 、プロパティタイプリストで[Built-in] (組み込み)を選択し、接続の詳細を手動で設定します。

  5. [Schema using CDC] (CDCを使用するスキーマ)フィールドで、[Repository] (リポジトリー)を選択し、[Metadata] (メタデータ)エントリーに保管されている[Leadfact]テーブルのスキーマを選択します。
  6. [Table using CDC] (CDCを使用するテーブル)フィールドに、CDCで取り込まれたテーブルの名前、このシナリオの場合はLeadfactを入力します。
  7. [Subscriber] (サブスクライバー)フィールドに、マーケティング、営業、および財務部門の変更されたデータ、[Sub_Mktg][Sub_Sales]、および[Sub_Finance]を抽出するサブスクライバーの名前をそれぞれ入力します。
  8. [Events to catch] (取得するイベント)フィールドで、サブスクライバーにより抽出される変更データのタイプに対応するチェックボックスをオンにします。このシナリオでは、3つのサブスクライバーについて3つのチェックボックスをオンにします。
  9. tLogRowコンポーネントをダブルクリックしてプロパティを設定します。
  10. [Sync columns] (カラムを同期)をクリックして、先行のコンポーネントからスキーマを取得します。
  11. ジョブを保存し、[F6]を押して実行します。

タスクの結果

顧客名は大文字に変換され、ここでは[Update] (更新)を表す[U]が表示されます。

いったん変更が抽出されると、変更テーブルでは利用できなくなります。抽出を確認するには、CDCで取得される[Leadfact]テーブルを右クリックし、[Views All Changes] (すべての変更の表示)を選択します。抽出された変更は表示されなくなっています。