tVectorWiseOutput標準プロパティ - 7.3

VectorWise

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > VectorWise
データガバナンス > サードパーティーシステム > DBコンポーネント > VectorWise
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > VectorWise

これらのプロパティは、Standardジョブフレームワークで実行されるtVectorWiseOutputを構成するために使用されます。

Standard tVectorWiseOutputコンポーネントは、データベースファミリーに属しています

このフレームワーク内のコンポーネントは、すべてのTalend製品で使用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントを参照してください。

基本設定

データベース

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います

 

[Built-in] (組み込み): プロパティデータは一元的に保管されません。

 

[Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。後続フィールドは、取得されたデータを使用して自動的に入力されます。

このアイコンをクリックすると、データベース接続ウィザードが開き、コンポーネント[Basic settings] (基本設定)ビューに設定したデータベース接続パラメーターが保存されます。

データベース接続パラメーターの設定と保存の詳細は、『 Talend Studioユーザーガイド』を参照してください。

[Use an existing connection] (既存の接続を使用する)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、『 Talend Studio ユーザーガイド』を参照してください。

[Host] (ホスト)

データベースサーバーのIPアドレス。

[Port] (ポート)

DBサーバーのリスニングポート番号。

[Database] (データベース)

データベースの名前。

[Username] (ユーザー名)[Password] (パスワード)

DBユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

[Table] (テーブル)

書き込まれるテーブルの名前。一度に書き込みができるテーブルは1つだけです。

[Action on table] (テーブルへのアクション)

定義済みのテーブルで、次のオペレーションの1つを実行できます。

[None] (なし): 操作は行われません。

[Drop and create a table] (ドロップしてテーブルを作成): テーブルが削除され、再び作成されます。

[Create a table] (テーブルの作成): テーブルが存在せず、作成されます。

[Create a table if not exists] (存在しない場合はテーブルを作成): テーブルが存在しない場合は、作成されます。

[Drop a table if exists and create] (テーブルがある場合はテーブルをドロップして作成): テーブルが既に存在する場合は削除され、再び作成されます。

[Clear a table] (テーブルのクリア): テーブルのコンテンツが削除されます。

[Action on data] (データへのアクション)

定義されたテーブルのデータでは、以下の操作を実行できます:

[Insert] (挿入): テーブルに新しいエントリを追加します。重複が見つかった場合、ジョブは停止されます。

[Update] (更新): 既存のエントリーが変更されます。

[Insert or update] (挿入または更新): 新しいレコードを挿入します。指定された参照を持つレコードが既に存在する場合は、更新されます。

[Update or insert] (更新または挿入): 指定された参照を使用してレコードを更新します。レコードが存在しない場合は、新しいレコードが挿入されます。

[Delete] (削除): 入力フローに対応するエントリーを削除します。

警告:

[Update] (更新)および[Delete] (削除)操作を行う主キーとして少なくとも1つのカラムを指定する必要があります。それには、[Edit Schema] (スキーマの編集)をクリックし、主キーに指定するカラムの横にあるチェックボックスをオンにします。高度な設定を行う場合は、[Advanced settings] (詳細設定)ビューをクリックして、[Update] (更新)および[Delete] (削除)操作の主キーを同時に定義できます。この場合は、[Use field options] (フィールドオプションを使う)チェックボックスをオンにして、[Key in update column] (更新のキーカラム)で、[Update] (更新)操作のベースとして使うカラム名の横にあるチェックボックスをオンにします。削除操作についても、[Key in delete column] (削除カラムの入力)で同じ手順を実行します。

[Schema] (スキーマ)[Edit schema] (スキーマの編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

 

Built-in (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

 

Repository (リポジトリー): スキーマは作成済みで、リポジトリーに保管されており、さまざまなプロジェクトやジョブデザインで再利用できます。

再使用するスキーマに整数またはファンクションのデフォルト値が指定されている場合は、これらのデフォルト値を引用符で囲まないように注意してください。引用符で囲まれている場合は手動で削除します。

詳細は、Talend Studioユーザーガイドでテーブルスキーマに関連する説明を参照してください。

 

スキーマを変更するには[Edit schema] (スキーマの編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを使用できます。

  • View schema (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • Change to built-in property (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • Update repository connection (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[Die on error] (エラー発生時に強制終了)

このチェックボックスは、デフォルトで選択されています。エラーの発生した行をスキップし、エラーが発生していない行の処理を完了するには、このチェックボックスをオフにします。必要に応じて[Row] (行) > [Rejects] (リジェクト)リンクを使用してエラー発生時に行を取得できます。

詳細設定

[Additional JDBC Parameters] (追加のJDBCパラメーター)

作成するデータベース接続に追加のJDBCパラメーターを指定します。

このプロパティは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使用する)チェックボックスがオンの場合には使用できません。

[Commit every] (コミットする間隔)

ノードのバッチがDBにコミットされるまでに完了しているべき行数。このオプションにより、トランザクションの質(ただしロールバックは含まない)、特に実行時のパフォーマンスの向上が保証されます。

[Additional Columns] (追加のカラム)

このオプションは、DBテーブルを作成する場合(ドロップありまたはドロップなし)には提供されません。このオプションにより、SQL関数を呼び出してカラムにアクションを実行できます。ただし、挿入、更新、削除のアクションでないこと、特定の事前処理を必要とするアクションでないことが条件です。

 

[Name:] (名前:)変更するか、または新しいカラムとして挿入するスキーマカラムの名前を入力します。

 

[SQL expression:] (SQL式:)関連するカラムデータを変更または挿入するために実行するSQLステートメントを入力します。

 

[Position:] (位置:)参照カラムに対して実行されるアクションに従って、[Before] (実行前)[Replace] (置換)または[After] (実行後)を選択します。

 

[Reference column:] (参照カラム:)新規または変更されたカラムを配置または置換するためにtDBOutputが使える参照のカラムを入力します。

[Use field options] (フィールドオプションの使用)

特にデータに二重のアクションがある場合、リクエストをカスタマイズするには、このチェックボックスをオンにします。

[Debug query mode] (デバッグクエリーモード)

このチェックボックスをオンにすると、データベースのエントリの処理中に各ステップが表示されます。

[Support null in "SQL WHERE" statement] ("SQL WHERE"ステートメントでnullをサポート)

DBテーブルに含まれているNull値を処理する場合は、このチェックボックスをオンにします。

注:

スキーマ内の対応するカラムで[Nullable] (nullを許可)チェックボックスがオンになっていることを確認してください。

[Use Batch] (バッチの使用)

このチェックボックスをオンにして、データ処理のバッチモードを有効にします。

このオプションは、Vectorwiseバージョン2.5以降でのみサポートされており、[Basic settings] (基本設定)タブの[Action on data] (データのアクション)ドロップダウンリストから[Insert] (挿入)を選択した場合にのみ使用できます。

[Batch Size] (バッチサイズ)

各バッチで処理するレコードの数を指定します。

このフィールドは、[Use batch mode] (バッチモードの使用)チェックボックスがオンの場合にのみ表示されます。

[tStat Catcher Statistics] (tStatキャッチャー統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

[Enable parallel execution] (並列実行の有効化)

このチェックボックスを選択すると、複数のデータフローを同時に処理することにより、高速データ処理を実行できます。このフィーチャーは、データベースまたは複数の挿入を並行して処理するアプリケーションの機能と、関係するCPUの数に依存していることに注意してください。[Number of parallel executions] (並列実行の数)フィールドで次のいずれかの操作を行います:
  • 実行する並列実行の数を入力する。
  • [Ctrl] + [Space]を押して、リストから適切なコンテキスト変数を選択する。詳細は、『 Talend Studioユーザーガイド』を参照してください。

並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得することはできないことに注意してください。

  • [Action on table] (テーブルのアクション)フィールドは、並列化ファンクションでは使用できません。したがって、テーブルを作成する場合は、tCreateTableコンポーネントを使用する必要があります。
  • 並列実行が有効になっている場合、グローバル変数を使用してサブジョブの戻り値を取得することはできません。

Global Variables

[Global Variables] (グローバル変数)

NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。

NB_LINE_UPDATED: 更新された行の数。これはAfter変数で、整数を返します。

NB_LINE_INSERTED: 挿入された行の数。これはAfter変数で、整数を返します。

NB_LINE_DELETED: 削除された行の数。これはAfter変数で、整数を返します。

NB_LINE_REJECTED: 拒否された行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細については、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントでは、DBクエリーの柔軟性によるメリットが提供されており、使用可能なすべてのSQLクエリーが網羅されています。

このコンポーネントは出力コンポーネントとして使用する必要があります。このコンポーネントを使って、データベース内のテーブルまたはテーブルのデータにアクションを実行できます。また、[Row] (行) > [Rejects] (リジェクト)リンクを使用して、エラーのあるデータをフィルタリングするリジェクトフローを作成することもできます。tMySqlOutputの使い方の例は、リジェクトリンクを使用してエラーデータを取得するを参照してください。

制限事項

ライセンスの互換性の問題のため、このコンポーネントの使用に必要な1つ以上のJARが提供されていません。この特定のコンポーネントに不足しているJARをインストールするには、Component (コンポーネント)タブビューの[Install] (インストール)ボタンをクリックします。Studioの Integration パースペクティブの[Modules] (モジュール)タブでも、不足しているすべてのJARを簡単に見つけて追加できます。詳細は、外部モジュールのインストールを参照してください。