tAS400CDCの標準プロパティ - Cloud - 8.0

Change Data Capture

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データガバナンス > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > データキャプチャーの変更

このプロパティはStandardジョブフレームワークで実行されているtAS400CDCを設定するために使います。

[Standard] (標準) tAS400CDCコンポーネントは、データベースファミリーに属しています。

このフレームワークのコンポーネントは、すべてのサブスクリプションベースのTalend製品で利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストで目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、親ジョブと子ジョブの間の既存の接続を共有したい場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、次のように実行します。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。
  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、 Talend Studio ユーザーガイドをご覧ください。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います。
  • [Built-in] (組み込み): プロパティデータは一元的に保管されません。

  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。次のフィールドは、取得したデータを使用して自動的に完了されます。

警告: 関連するボタンをクリックしてDBタイプをリセットし、CDC接続を選択します。

[DB Version] (DBバージョン)

使っているAS/400データベースバージョンを選択します。

[Host name] (ホスト名)

データベースサーバーのIPアドレス。

[Database] (データベース)

CDCデータベースの名前。

注: 変更されたデータが保管されているCDCデータベースは、ソースデータが含まれているものとは別になっている必要があります。

Username (ユーザー名)Password (パスワード)

DBユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

Schema (スキーマ)およびEdit schema (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

  • [Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

警告: 関連するボタンをクリックしてDBタイプをリセットし、CDC接続のスキーマを選択します。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。

    変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[Table Name] (テーブル名)

データに加えられた変更を取得するソーステーブルの短い名前。ターゲットCDCテーブルは、この短い名前を使って自動的に自らの名前を付けます。

[Source Library] (ソースライブラリー)

AS/400データベースのソースライブラリー。

注: ライブラリー名の長さは10文字以内にしてください。一般にデータベース名が使われます。

[Subscriber] (サブスクライバー)

変更テーブルを使用するアプリケーションの名前を入力します。

[Events to catch] (取得するイベント)

  • [Insert] (挿入): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルに挿入されたデータを取得できます。

  • [Update] (更新): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルで更新されたデータを取得できます。

  • [Delete] (削除): このチェックボックスをオンにすると、前回の抽出以降に変更テーブルで削除されたデータを取得できます。

[Member] (メンバー)

目的のレコードを持つメンバーの名前を入力します。メンバーとはライブラリー内の物理ファイルの一部であり、エントリーのグループが含まれています。詳細は、http://www.ibm.comAS/400ファイルのフォーマットを検索してください。

詳細設定

[Additional JDBC parameters] (追加のJDBCパラメーター)

作成するDB接続の接続の追加プロパティを指定します。このオプションは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使う)チェックボックスをオンにしている場合は使えません。

[Process all input data and empty CDC table] (すべての入力データと空のCDCテーブルを処理する)

すべての入力データと空のCDCテーブルを処理するには、このオプションを選択します。

[Keep data in CDC Table] (CDCテーブルにデータを保持)

加えた変更を参照後も1つ以上のターゲットシステムで使用できる状態にしておくには、このチェックボックスをオンにします。

[Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)

すべてのStringカラム/Charカラムの先頭や末尾の空白を削除する場合は、このチェックボックスをオンにします。

[Trim column] (カラムをトリミング)

定義されたカラムから先頭や末尾の空白を削除します。

注: [Trim all the String/Char columns] (すべての文字列/文字カラムをトリミング)の選択解除して、このフィールドのトリミングカラムを有効にします。

[Disable command] (コマンドを無効化)

RUNCDCプログラムを自身で手動で呼び出し、CDCテーブルに変更を書き込むことができるようにするには、このチェックボックスをオンにします。

[Customize command] (コマンドをカスタマイズ)

tAS400CDCによって実行されるコマンドのパラメーターを指定するには、このチェックボックスをオンにします。

tAS400CDCによって実行されるコマンドの構文を以下に示します。

library/RUNCDC OPTION(*RUN)
               FILE(DATA_LIB/FILE)
               JOURNAL(*FILE) LIBOUT(*DEFAULT) MBROPT(*ADD) MODE(*CURRENT) DTCHJRN(*YES)

各部の説明

  • OPTIONは、実行する操作を指定します。

    指定できるのは、*RUN (デフォルト)、*ENDRUN*HELP*LOG*PARM*TABです。

  • FILEは、抽出されるファイルをそのファイルが存在するライブラリーと共にリスト表示します。

    RUNCDCコマンドは、同じライブラリー内にある複数のファイルからデータを抽出できます。抽出するためには、FILE(DATA_LIB/FILE1 DATA_LIB/FILE2 DATA_LIB/FILE3...)という形式でこのパラメーターを指定します。300ファイルまで指定できます。

  • JOURNALは、処理されるジャーナルの名前とライブラリーを指定します。

    デフォルトではファイルに添付されているジャーナルが指定されます。

  • LIBOUTは、生成されたファイルの出力ライブラリーを指定します。

  • MBROPTは生成されたファイルの出力オプションを指定するもので、*ADD (デフォルト)と*REPLACEのいずれかとなります。

  • MODEはログの読み取りモードを指定するもので、*DETACHED (デフォルト)、*CURRENT*REELのいずれかとなります。

  • DTCHJRNは、処理の開始時にジャーナルレシーバーを切り離す必要があるかどうかを指定します。

    このパラメーターは、*YES (デフォルト)と*NOのいずれかとなります。このパラメーターは、MODEパラメーターの値がDETACHEDの場合のみ使用されます。

デフォルトでは、コンポーネントは次のコマンドを実行します。

<CDC_library_name>/RUNCDC FILE(<Source_library_name>/<Source_table_name>) 
                          LIBOUT(<CDC_library_name>) MODE(*DETACHED) MBROPT(*ADD) DTCHJRN(*YES)

RUNCDCコマンドの詳細は、CDC_Documentation_1.09_EN.pdfを参照してください。このドキュメントは<Studio_install>\plugins\org.talend.designer.cdc_<version>\resource\にあります。

tStatCatcher [Statistics] (統計情報)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

使用方法

使用ルール

このコンポーネントは、開始コンポーネントとして使用されます。出力コンポーネントと行[Main] (メイン)リンクが必要です。

CDCが必要とするジャーナルとレシーバーは通常、AS/400システムの管理者が管理しています。この理由で、Studioのバージョン5.4.2以降では、tAS400CDCRUNCDCプログラムのみを実行し、そのAS/400システムのジャーナルまたはレシーバーの作成、アクティブ化、非アクティブ化、変更、または削除を自動的に行わなくなっています。これらの操作を行う場合は、AS/400管理者に事前に連絡する必要があります。御社のポリシーに応じて、管理者はユーザー自身で操作を行えるように許可を与えるか、または管理者自身が操作を行います。

この変更のため、tAS400CDCコンポーネントは5.4.2以降、5.4.1以前のバージョンで実行していた次のコマンドを実行しなくなります。

CHGJRN JRN(<Source_library_name>/<Source_table_name>) JRNRCV(*GEN)

このコマンドは、古いレシーバーをジャーナルから分離し、新しいレシーバーをジャーナルに装着して、最新の変更を取得できるようにするために使われます。続いて、このコンポーネントを実行する前にAS/400システムでこのコマンドを実行するよう推奨されます。または、[Customize command] (コマンドをカスタマイズ)チェックボックスがオンの場合は、切断と接続のプロセスを自動化するために上記のサンプルコマンドを入力します。

AS/400用のCDCがバージョン5.4.2以降Studioでどう処理されるかについては、 Talend Studioユーザーガイドで、CDCアーキテクチャーについて、およびAS/400用の[Redo/Archive log] (再実行/アーカイブログ)モード(ジャーナル)におけるCDCの設定方法について説明しているセクションを参照してください。