tGreenplumBulkExecの標準プロパティ - Cloud - 8.0

Greenplum

Version
Cloud
8.0
Language
日本語
Product
https://talend.poolparty.biz/coretaxonomy/16
https://talend.poolparty.biz/coretaxonomy/17
https://talend.poolparty.biz/coretaxonomy/18
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Greenplum
データガバナンス > サードパーティーシステム > DBコンポーネント > Greenplum
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Greenplum
Last publication date
2024-04-15

このプロパティはStandardジョブフレームワークで実行されているtGreenplumBulkExecを設定するために使います。

[Standard] (標準) tGreenplumBulkExecコンポーネントは、データベースファミリーに属しています。

このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかです。

 

[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。

 

[Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。後続フィールドは、取得されたデータを使用して自動的に入力されます。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストで目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、親ジョブと子ジョブの間の既存の接続を共有したい場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、次のように実行します。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。
  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、 Talend Studio ユーザーガイドをご覧ください。

[Host] (ホスト)

データベースサーバーのIPアドレス。

[Port] (ポート)

DBサーバーのリスニングポート番号。

[Database] (データベース)

データベースの名前。

[Schema] (スキーマ)

スキーマの正確な名前。

[Username] (ユーザー名)[Password] (パスワード)

DBユーザー認証データ。

パスワードを入力するためには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符で囲んで入力して[OK]をクリックし、設定を保存します。

[Table] (テーブル)

書き込まれるテーブルの名前。一度に書き込みができるテーブルは1つだけです。

[Action on table] (テーブルでのアクション)

定義済みのテーブルで、次のオペレーションの1つを実行できます。

[None] (なし): 操作は行われません。

[Drop and create a table] (ドロップしてテーブルを作成): テーブルが削除され、再び作成されます。

[Create a table] (テーブルの作成): テーブルが存在せず、作成されます。

[Create a table if not exists] (存在しない場合はテーブルを作成): テーブルが存在しない場合は作成されます。

[Drop a table if exists and create] (存在する場合はテーブルをドロップして作成): テーブルが既に存在する場合は削除され、再び作成されます。

[Clear a table] (テーブルをクリア): テーブルのコンテンツが削除されます。

[Filename] (ファイル名)

ロードするファイルの名前。

警告:

このファイルは、[Host] (ホスト)フィールドのURIで指定されたマシン上に置かれているため、データベースサーバーと同じマシン上にある必要があります。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

 

[Built-in] (組み込み): このコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

再使用するスキーマに整数またはファンクションのデフォルト値が指定されている場合は、これらのデフォルト値を引用符で囲まないようにご注意ください。引用符で囲まれている場合は手動で削除します。

詳細は、Talend Studioユーザーガイドでテーブルスキーマに関連する説明をご覧ください。

 

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。

    変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

詳細設定

[Additional JDBC Parameters] (追加のJDBCパラメーター)

作成するデータベース接続に追加のJDBCパラメーターを指定します。

[DB driver] (DBドライバー)

ドロップダウンリストから目的のデータベースドライバー(GreenplumPostgreSQLのいずれか)を選択します。デフォルトではGreenplumに設定されています。

このオプションは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)が選択されていない場合に利用できます。

[Action on data] (データでのアクション)

実行する操作を選択します。

[Bulk insert] (バルク挿入) [Bulk update] (バルクアップデート)選択したアクションによって、要求される詳細は異なります。

[Copy the OID for each row] (各行のOIDをコピー)

各行のIDアイテムを取得します。

[Contains a header line with the names of each column in the file] (ファイルの各カラム名を持つヘッダー行を含む)

テーブルにヘッダーが含まれるように指定します。

[File type] (ファイルタイプ)

処理するファイルタイプを選択します。

[Null string] (null文字列)

値がnullであることを示すために表示される文字列。

[Fields terminated by] (フィールド区切り)

フィールドを区切る文字、文字列、または正規表現。

[Escape char] (エスケープ文字)

エスケープする行の文字

[Text enclosure] (テキストエンクロージ​ャー)

テキストを囲むために使用する文字。

[Force not null for columns] (カラムにnull不許容)

カラムのnull値の許容性を定義します。

[Force not null] (null不許容): null以外として定義するカラムの横にあるチェックボックスをオンにします。

[tStat Catcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

使用方法

[Usage rule] (使用ルール)

このコンポーネントは一般にtGreenplumOutputBulkコンポーネントと共に使います。一緒に使うと、Greenplumデータベースをフィードする時にパフォーマンスが向上します。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データ構造が同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。

動的パラメーターの使用サンプルは、コンテキストベースの動的接続によるデータベースからのデータの読み取りおよび動的に読み取られた接続パラメーターを使用した異なるMySQLデータベースからのデータの読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。