tVerticaOutputBulkExecの標準プロパティ - 7.3

Vertica

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Vertica
データガバナンス > サードパーティーシステム > DBコンポーネント > Vertica
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Vertica
Last publication date
2024-02-22

これらのプロパティは、標準ジョブのフレームワークで実行されているtVerticaOutputBulkを設定するために使われます

標準tVerticaOutputBulkコンポーネントは、データベースファミリーに属しています。

このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Property Type] (プロパティタイプ)

接続の詳細を設定する方法を選択します。

  • [Built-In] (組み込み): このコンポーネントの接続の詳細がローカルに設定されます。関連するすべての接続のプロパティ値を手動で指定する必要があります。

  • [Repository] (リポジトリー): [Repository] (リポジトリー) > [Metadata] (メタデータ)で一元的に保存された接続の詳細が、このコンポーネントによって再使用されます。このチェックボックスの横にある [...] ボタンをクリックし、表示された [Repository Content] (リポジトリーのコンテンツ)ダイアログボックスで、再使用する接続の詳細を選択すると、関連するすべての接続のプロパティに値が自動的に入力されます。

[DB Version] (データベースバージョン)

データベースのバージョンを選択します。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。

ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。

  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベル全体でデータベース接続を共有する方法の例は、Talend Studioユーザーガイドをご覧ください。

[Host] (ホスト)

データベースのIPアドレスまたはホスト名。

[Port] (ポート)

データベースのリスニングポート番号。

[DB Name] (DB名)

データベースの名前。

[Schema] (スキーマ)

データベースのスキーマ。

[Username] (ユーザー名)[Password] (パスワード)

データベースユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。

[Action on data] (データでのアクション)

定義されたテーブルのデータに対して実行する操作を選択します。

  • [Bulk insert] (バルク挿入): 単一行の挿入を行う代わりに、一度に複数の行をテーブルに挿入します。重複が見つかると、ジョブは停止します。

  • [Bulk update] (バルクアップデート): 複数の行を同時にアップデートします。

[Table] (テーブル)

データが書き込まれるテーブルの名前。

[Action on table] (テーブルでのアクション)

定義されたテーブルに対して実行する操作を選択します。

  • [Default] (デフォルト): 操作は行われません。

  • [Drop and create table] (ドロップしてテーブルを作成): テーブルが削除され、再作成されます。

  • [Create table] (テーブルを作成): テーブルが存在しないため、作成されます。

  • [Create table if not exists] (テーブルが存在しない場合は作成): テーブルが存在しない場合は作成されます。

  • [Drop table if exist and create] (テーブルが存在する場合はドロップして作成): テーブルが既に存在する場合は削除されて再作成されます。

  • [Clear table] (テーブルをクリア): テーブルのコンテンツが削除されます。この操作はロールバックできます。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

  • [Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

再使用するスキーマに整数またはファンクションのデフォルト値が指定されている場合は、これらのデフォルト値を引用符で囲まないようにご注意ください。引用符で囲まれている場合は手動で削除します。

詳細は、Talend Studioユーザーガイドでテーブルスキーマに関連する説明をご覧ください。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。
注: 変更を加えると、スキーマは自動的に組み込みになります。
  • [View schema] (スキーマを表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[File name] (ファイル名)

生成するファイルへのパス。

このファイルは、Studioがインストールされているか、またはこのコンポーネントを使っているジョブがデプロイされているのと同じマシンに生成されます。

[Append] (追加)

このチェックボックスをオンにすると、ファイルの最後に新しい行が追加されます。

[Use schema columns for Copy] (コピー用のスキーマカラムを使用)

COPYステートメントのカラムオプションを使用する場合は、このチェックボックスをオンにして、テーブル内の1つ以上の指定されたカラムにロードを制限できるようにします。詳細は、Vertica COPY SQL Statementをご覧ください。

詳細設定

[Additional JDBC Parameters] (追加のJDBCパラメーター)

作成するデータベース接続に追加のJDBCパラメーターを指定します。

これらのプロパティは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合は利用できません。

ストリーム名

特定のロードを識別するのに役立つロードのストリーム名。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Write to ROS (Read Optimized Store)] (ROS (Read Optimized Store)に書込み)

データは圧縮されて事前にソートされているため、読み取りを最適化するために、このチェックボックスをオンにしてデータを物理ストレージエリアに保存します。

[Exit Job if no row was loaded] (行がロードされない時はジョブを終了)

行がロードされていない場合、ジョブは自動的に停止します。

[Missing columns as null] (欠落カラムをNullに)

スキーマで指定されたカラムと一致するデータが不十分な場合に欠落しているカラムにNULL値を挿入する場合は、このチェックボックスをオンにします。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Skip Header] (ヘッダーをスキップ)

このチェックボックスをオンにして、その横に表示されるフィールドに、ファイル内でスキップするレコードの数を指定します。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Record terminator] (レコード終端記号)

このチェックボックスをオンにして、その横に表示されるフィールドに、ファイル内の各レコードの終端を示すために使用するリテラル文字列を指定します。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Enclosed by character] (文字で囲む)

データを囲む文字を設定する場合は、このチェックボックスをオンにします。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Field Separator] (フィールド区切り)

フィールドを区切る文字、文字列、正規表現のいずれか。

[Null String] (null文字列)

値がnullであることを示すために表示される文字列。

[Include Header] (ヘッダーを含める)

このカラムヘッダーをファイルに含めるには、このチェックボックスをオンにします。

[Encoding] (エンコーディング)

リストからエンコーディング方式を選択するか、または[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。

[Reject not fitted values] (値が合わないためにリジェクト)

このチェックボックスをオンにすると、char、varchar、binary、およびvarbinaryタイプのデータ行がターゲットテーブルに適合しない場合にリジェクトされます。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Maximum number of rejected records] (リジェクトレコード数の上限)

このチェックボックスをオンにして、その横に表示されるフィールドに、ロードが失敗するまでにリジェクトできるレコードの最大数を指定します。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Stop and rollback if any row is rejected] (リジェクトされた行がある場合は停止してロールバック)

行がリジェクトされた場合にデータをロードせずにロードを停止してロールバックする場合は、このチェックボックスをオンにします。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Don't commit] (コミットしない)

結果を自動的にコミットせずに一括ロードトランザクションを実行する場合は、このチェックボックスをオンにします。これは、単一のトランザクションで複数の一括ロードを実行する場合に役立ちます。

これらのプロパティは、Vertica6.0以降を使用している場合のみ利用できます。

[Rejected data file] (リジェクトデータファイル)

リジェクトされた行が書き込まれるファイルを指定します。

これらのプロパティは、[Action on data] (データでのアクション)ドロップダウンリストから、[Bulk insert] (バルク挿入)が選択されている場合のみ利用できます。

[Exception log file] (例外ログファイル)

リジェクトされた行が書き込まれるファイルを指定します。このログは、リジェクトされた各行がリジェクトされた理由を説明しています。

これらのプロパティは、[Action on data] (データでのアクション)ドロップダウンリストから、[Bulk insert] (バルク挿入)が選択されている場合のみ利用できます。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

ACCEPTED_ROW_NUMBER

データベースに読み取られた行数。これはAfter変数で、整数を返します。

REJECTED_ROW_NUMBER

リジェクトされた行数。これはAfter変数で、整数を返します。

ERROR_MESSAGE

エラー発生時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。

使用方法

使用ルール

このコンポーネントは、データベースにロードするデータが特定の変換を必要としない場合に主に使います。

Talend StudioとVerticaデータベースは、非常に高速で手頃なデータウェアハウスとデータマートアプリケーションを作成します。Verticaに接続するようにTalend Studioを構成する方法は、TalendおよびHPVerticaのヒントとテクニックをご覧ください。