tPostgresqlCDCの標準プロパティ - 7.2

Change Data Capture

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データガバナンス > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更

このプロパティはStandardジョブフレームワークで実行されているtPostgresqlCDCを設定するために使います。

[Standard] (標準) tPostgresqlCDCコンポーネントは、データベースファミリーに属しています。

このフレームワークのコンポーネントは、すべてのサブスクリプションベースのTalend製品で利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。

 

[Built-in] (組み込み): プロパティデータは一元的に保管されません。

 

[Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。次のフィールドは、取得したデータを使用して自動的に完了されます。

警告:

関連するボタンをクリックしてDBタイプをリセットし、CDC接続を選択します。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、 Talend Studio ユーザーガイドをご覧ください。

[DB Version] (DBバージョン)

データベースバージョンのリスト。

[Host] (ホスト)

データベースサーバーのIPアドレス。

[Port] (ポート)

DBサーバーのリスニングポート番号。

[Database] (データベース)

データベースの名前。

[Schema] (スキーマ)

スキーマの名前。

[Username] (ユーザー名)[Password] (パスワード)

DBユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

[Schema using CDC] (CDCを使用したスキーマ)および[Edit Schema] (スキーマを編集)

スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保管されます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

 

[Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

警告:

関連するボタンをクリックしてDBタイプをリセットし、CDC接続のスキーマを選択します。

[Table] (テーブル)

データに加えられたすべての変更を取り込むソーステーブルを選択します。

[Subscriber] (サブスクライバー)

変更テーブルを使用するアプリケーションの名前を入力します。

[Events to catch] (取得するイベント)

[Insert] (挿入): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルに挿入されたデータを取得できます。

[Update] (更新): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルで更新されたデータを取得できます。

[Delete] (削除): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルで削除されたデータを取得できます。

詳細設定

[Additional JDBC Parameters] (追加のJDBCパラメーター)

作成するデータベース接続に追加のJDBCパラメーターを指定します。

このプロパティは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合は利用できません。

[Keep data in CDC Table] (CDCテーブルにデータを保持)

加えた変更を参照後も1つ以上のターゲットシステムで使用できる状態にしておくには、このチェックボックスをオンにします。

[Use cursor] (カーソルの使用)

このチェックボックスをオンにすると、いつでも作業する行数を指定できます。このオプションにより、パフォーマンスを最適化できます。

[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)

文字列を含むすべてのカラムでフィールドの先頭または末尾にあるスペースを削除するには、このチェックボックスをオンにします。

[Trim column] (カラムをトリミング)

定義されたカラムから先頭や末尾の空白を削除します。

注:

[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)の選択を解除して、このフィールドのトリミングカラムを有効にします。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、ログデータがコンポーネントレベルで収集されます。

[Enable parallel execution] (並列実行を有効化)
このチェックボックスをオンにすると、複数のデータフローを同時に処理することにより、高速データ処理を実行できます。このフィーチャーは、データベースまたは複数の挿入を並行して処理するアプリケーションの機能と、関係するCPUの数に依存していることにご注意ください。[Number of parallel executions] (並列実行の数)フィールドで次のいずれかの操作を行います:
  • 実行する並列実行の数を入力する。
  • [Ctrl] + [Space]を押して、リストから適切なコンテキスト変数を選択する。詳細は、 Talend Studioユーザーガイドをご覧ください。

並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得することはできないことにご注意ください。

  • [Action on table] (テーブルのアクション)フィールドは、並列化ファンクションでは使用できません。したがって、テーブルを作成する場合は、tCreateTableコンポーネントを使用する必要があります。
  • 並列実行が有効になっている場合、グローバル変数を使用してサブジョブの戻り値を取得することはできません。

グローバル変数

[Global Variables] (グローバル変数)

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、 Talend Studio ユーザーガイドをご覧ください。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

使用方法

使用ルール

このコンポーネントは開始コンポーネントとして使用されます。出力コンポーネントと行メインリンクが必要です。