tMSSqlCDCの標準プロパティ - Cloud - 8.0

Change Data Capture

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データガバナンス > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更

このプロパティはStandardジョブフレームワークで実行されているtMSSqlCDCを設定するために使います。

[Standard] (標準) tMSSqlCDCコンポーネントは、データベースファミリーに属しています。

このフレームワークのコンポーネントは、すべてのサブスクリプションベースのTalend製品で利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストで目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、親ジョブと子ジョブの間の既存の接続を共有したい場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、次のように実行します。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。
  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、 Talend Studio ユーザーガイドをご覧ください。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。

  • [Built-in] (組み込み): プロパティデータは一元的に保管されません。
  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。次のフィールドは、取得したデータを使用して自動的に完了されます。
警告: 関連するボタンをクリックしてDBタイプをリセットし、CDC接続を選択します。

[JDBC Provider] (JDBCプロバイダー)

使うJDBCドライバーのプロバイダー、[Microsoft] (マイクロソフト) (デフォルト、推奨)または[Open source JTDS] (オープンソースJTDS)を選択します。

Microsoftを選択した場合は、SQL Server用Microsoft JDBCドライバーを[Microsoftダウンロードセンター]からダウンロードし、ダウンロードしたzipファイルを解凍し、解凍したフォルダーからお使いのJREバージョンに基づいてjarを選択し、jarの名前をmssql-jdbc.jarに変更し、手動でインストールする必要があります。jarの選択については、Microsoftダウンロードセンターでシステム要件情報をご覧ください。

このコンポーネントを Talend Runtimeでデータソースと併用する場合は、[Open source JTDS] (オープンソースJTDS)ドライバーを使用する必要があります。

Host (ホスト)

データベースサーバーのIPアドレス。

[Port] (ポート)

DBサーバーのリスニングポート番号。

[Database] (データベース)

データベースの名前。

[Schema] (スキーマ)

スキーマの名前。

[Username] (ユーザー名)[Password] (パスワード)

DBユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

CDCを使う[Schema] (スキーマ)[Edit Schema] (スキーマを編集)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。

[Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

警告: 関連するボタンをクリックしてDBタイプをリセットし、CDC接続のスキーマを選択します。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。

    変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

テーブル名

データに加えられた変更を取り込むソーステーブルを選択します。

[Subscriber] (サブスクライバー)

変更テーブルを使用するアプリケーションの名前を入力します。

[Events to catch] (取得するイベント)

[Insert] (挿入): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルに挿入されたデータを取得できます。

[Update] (更新): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルで更新されたデータを取得できます。

[Delete] (削除): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルで削除されたデータを取得できます。

[Limit] (制限事項)

サブスクライバーが変更テーブルから実行するたびに復元できる、消費される行の最大数。

詳細設定

[Additional JDBC parameters] (追加のJDBCパラメーター)

作成するDB接続の接続の追加プロパティを指定します。このオプションは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使用)チェックボックスをオンにしている場合は使用できません。

[Keep data in CDC table] (CDCテーブルでデータを保持) 加えた変更を参照後も1つ以上のターゲットシステムで使用できる状態にしておくには、このチェックボックスをオンにします。

[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)

文字列を含むすべてのカラムでフィールドの先頭または末尾にあるスペースを削除するには、このチェックボックスをオンにします。

[Trim column] (カラムをトリミング)

定義されたカラムから先頭や末尾の空白を削除します。

注: [Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)の選択を解除して、このフィールドのトリミングカラムを有効にします。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

[Enable parallel execution] (並列実行を有効化)
このチェックボックスをオンにすると、複数のデータフローを同時に処理することにより、高速データ処理を実行できます。このフィーチャーは、データベースまたは複数の挿入を並行して処理するアプリケーションの機能と、関係するCPUの数に依存していることにご注意ください。[Number of parallel executions] (並列実行の数)フィールドで次のいずれかの操作を行います:
  • 実行する並列実行の数を入力する。
  • [Ctrl] + [Space]を押して、リストから適切なコンテキスト変数を選択する。詳細は、 Talend Studioユーザーガイドをご覧ください。

並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得することはできないことにご注意ください。

  • [Action on table] (テーブルでのアクション)フィールドは、並列化機能では利用できません。したがって、テーブルを作成する場合は、tCreateTableコンポーネントを使用する必要があります。
  • 並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得できません。

グローバル変数

[Global Variables] (グローバル変数) 

NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合のみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、 Talend Studio ユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、開始コンポーネントとして使用されます。出力コンポーネントと行[Main] (メイン)リンクが必要です。