tMSSqlBulkExecの標準プロパティ - Cloud - 8.0

MSSql

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > MSSql
データガバナンス > サードパーティーシステム > DBコンポーネント > MSSql
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > MSSql

このプロパティはStandardジョブフレームワークで実行されているtMSSqlBulkExecを設定するために使います。

[Standard] (標準) tMSSqlBulkExecコンポーネントは、データベースファミリーに属しています。

このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Property type] (プロパティタイプ)

[Built-in] (組み込み)または[Repository] (リポジトリー)のいずれかで次の設定を行います

  • [Built-In] (組み込み): プロパティデータは一元的に保存されません。
  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。後続フィールドは、取得されたデータを使用して自動的に入力されます。

[JDBC Provider] (JDBCプロバイダー)

使うJDBCドライバーのプロバイダー、[Microsoft] (マイクロソフト) (デフォルト、推奨)または[Open source JTDS] (オープンソースJTDS)を選択します。

Microsoftを選択した場合は、SQL Server用Microsoft JDBCドライバーを[Microsoftダウンロードセンター]からダウンロードし、ダウンロードしたzipファイルを解凍し、解凍したフォルダーからお使いのJREバージョンに基づいてjarを選択し、jarの名前をmssql-jdbc.jarに変更し、手動でインストールする必要があります。jarの選択については、Microsoftダウンロードセンターでシステム要件情報をご覧ください。

OSGiビルドには、オープンソースのjTDSJDBCドライバーが含まれないことにご注意ください。このコンポーネントが含まれているジョブをOSGiバンドルとしてビルドする必要がある時は、Microsoftの公式JDBCドライバーを使用してください。このドライバーを使用しない場合、このコンポーネントは Talend Runtimeに正しくインストールされたjTDSJDBCドライバーを使用するデータソースでのみ機能します。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストで目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、親ジョブと子ジョブの間の既存の接続を共有したい場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、次のように実行します。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。
  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、 Talend Studio ユーザーガイドをご覧ください。

[Host] (ホスト)

使うデータベースサーバーかAzure Synapse AnalyticsのIPアドレスまたはホスト名を指定します。

サーバーが存在するマシンでSQL Server Browserサービスが実行中である場合は、このフィールドにホスト名とインスタンス名を{host_name}\{instance_name}という形式で指定すれば、TCPダイナミックポートを通じてネームドインスタンスに接続できるようになります。この場合は[Port] (ポート)フィールドを空白のまましておきます。関連情報は、SQL Server Browser serviceをご覧ください。

[Port] (ポート)

使うデータベースサーバーかAzure Synapse Analyticsのリスニングポート番号を入力します。

サーバーが存在するマシンでSQL Server Browserサービスが実行中である場合は、[Host] (ホスト)フィールドにホスト名とインスタンス名を入力し、このフィールドを空にしておけば、TCPダイナミックポートを通じてネームドインスタンスに接続できるようになります。関連情報は、SQL Server Browser serviceをご覧ください。

[Database] (データベース)

データベースの名前。

[Schema] (スキーマ)

スキーマの名前。

[Username] (ユーザー名)[Password] (パスワード)

認証データを入力します。

パスワードを入力するためには、[Password] (パスワード)フィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符で囲んで入力して[OK]をクリックし、設定を保存します。

[Additional JDBC Parameters] (追加のJDBCパラメーター)フィールドにintegratedSecurity=trueを追加し、これら2つのフィールドを空にしておけば、Windows[Type 2 integrated authentication] (タイプ2の統合認証)を使用できるようになります。関連情報は、Building the connection URLConnecting with integrated authentication On Windowsというセクションをご覧ください。

[Table] (テーブル)

書き込まれるテーブルの名前。一度に書き込みができるテーブルは1つだけです。挿入オペレーションが成功するには、テーブルが既に存在している必要があります。

[Action on table] (テーブルでのアクション)

定義済みのテーブルで、次のオペレーションの1つを実行できます。

[None] (なし): 操作は行われません。

[Drop and create table] (ドロップしてテーブルを作成): テーブルが削除され、再作成されます。

[Create table] (テーブルを作成): テーブルが存在しないため、作成します。

[Create table if not exists] (存在しない場合はテーブルを作成): テーブルが存在しない場合は作成されます。

[Drop table if exists and create] (存在する場合はテーブルをドロップして作成): テーブルが既に存在する場合は削除されて再作成されます。

[Clear table] (テーブルをクリア): テーブルの内容が削除されます。

[Truncate table] (テーブルを切り詰める): テーブルの内容が削除されます。操作をロールバックすることはできません。

[Use existing dynamic schema] (既存のダイナミックスキーマを使用)

tSetDynamicSchemaコンポーネントによって生成されたダイナミックスキーマを使用する場合はこのオプションを選択します。このオプションではtSetDynamicSchemaコンポーネントが少なくとも1つ必要です。

[Dynamic schema] (ダイナミックスキーマ)ドロップダウンリストで、目的のダイナミックスキーマを生成するコンポーネントを選択します。

Schema (スキーマ)およびEdit schema (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

[Built-in] (組み込み): このコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

再使用するスキーマに整数またはファンクションのデフォルト値が指定されている場合は、これらのデフォルト値を引用符で囲まないようにご注意ください。引用符で囲まれている場合は手動で削除します。

詳細は、Talend Studioユーザーガイドでテーブルスキーマに関連する説明をご覧ください。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。

    変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[Remote File Name] (リモートファイル名)

ロードするファイルの名前。

注: このファイルは、データベースサーバーと同じマシンにあることも、別のマシンにあることもあります。ファイルがデータベースサーバーと同じマシンにある場合は、このフィールドにファイルへのパスを入力します。ファイルが別のマシンにある場合は、このフィールドにファイルの汎用命名規則(UNC)名(すなわち\\{Servername}\{Sharename}\{Path}\{Filename})を入力します。後者の場合はファイルを読み取る権限が必要となります。関連情報は、Bulk importing to SQL Server from a remote data fileをご参照ください。

詳細設定

アクション

実行するアクションを選択します。

[Bulk insert] (バルク挿入) [Bulk update] (バルクアップデート)[Bcp query out] (BCPクエリーアウト): 必要な情報は、選択したアクションによって異なります。

追加のJDBCパラメーター

作成するデータベース接続に追加のJDBCパラメーターを指定します。

このプロパティは、[Basic settings] (基本設定)[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合は利用できません。

[Authenticate using Azure Active Directory] (Azure Active Directoryを使って認証)

接続を確立する時にAzure Active Directory認証を使うには、このオプションを選択します。関連情報は、Azure AD Authenticationをご覧ください。

このオプションは、[Basic settings] (基本設定)ビューの[JDBC Provider] (JDBCプロバイダー)ドロップダウンリストでMicrosoftが選択されている場合に利用できます。

[Fields terminated by] (フィールド区切り)

フィールドを区切る文字、文字列、または正規表現。

[Rows terminated] (行区切り)

行を区別するための文字列(例: Unixでは"\n"on)。

[First row] (最初の行)

アクションを開始する行の番号を入力します。

[Code page] (コードページ)

特定の文字セットを数値コードポイント値にマッピングするために使われるOEMコードページ。

[Data file type] (データファイルのタイプ)

処理するデータのタイプを選択します。

Output (出力)

Microsoft SQL Serverデータベースの標準出力に使うタイプを選択します。
  • [to console] (コンソールに出力)
  • [to global variable] (グローバル変数に出力)

このプロパティは、[Action] (アクション)ドロップダウンリストで[BCP query out] (BCPクエリーアウト)が選択されている場合に利用できます。

[Fire Triggers] (トリガーの起動)

このチェックボックスをオンにすると、バルク挿入操作中にデータが読み込まれるテーブルで定義された挿入トリガーが実行されます。

このプロパティは、[Action] (アクション)ドロップダウンリストで[Bulk insert] (バルク挿入)が選択されている場合に利用できます。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

[Enable parallel execution] (並列実行を有効化)

このチェックボックスをオンにすると、複数のデータフローを同時に処理することにより、高速データ処理を実行できます。このフィーチャーは、データベースまたは複数の挿入を並行して処理するアプリケーションの機能と、関係するCPUの数に依存していることにご注意ください。[Number of parallel executions] (並列実行の数)フィールドで次のいずれかの操作を行います。
  • 実行する並列実行の数を入力する。
  • Ctrl + スペースを押して、リストから適切なコンテキスト変数を選択する。詳細は、 Talend Studioユーザーガイドをご覧ください。

並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得することはできないことにご注意ください。

  • [Action on table] (テーブルでのアクション)フィールドは、並列化機能では利用できません。したがって、テーブルを作成する場合は、tCreateTableのコンポーネントを使用する必要があります。
  • 並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得できません。

使用方法

使用ルール

このコンポーネントは、tMSSqlOutputBulkコンポーネントと共に使います。一緒に使えば、MSSqlデータベースをフィードする時にパフォーマンスが向上します。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データ構造が同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。

動的パラメーターの使用サンプルは、コンテキストベースの動的接続によるデータベースからのデータの読み取りおよび動的に読み取られた接続パラメーターを使用した異なるMySQLデータベースからのデータの読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。

制限事項

ライセンスの互換性の問題のため、このコンポーネントの使用に必要な1つ以上のJARが提供されていません。この特定のコンポーネントに不足しているJARをインストールするには、Component (コンポーネント)タブビューの[Install] (インストール)ボタンをクリックします。Studioの Integration パースペクティブの[Modules] (モジュール)タブでも、不足しているすべてのJARを簡単に見つけて追加できます。詳細は、外部モジュールのインストールをご覧ください。外部モジュールをインストールする方法の詳細は、Talend Help Center (https://help.talend.com)をご覧ください。