tMarkLogicBulkLoad標準プロパティ - 7.2

MarkLogic

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MarkLogic

このプロパティはStandardジョブフレームワークで実行されているtMarkLogicBulkLoadを設定するために使います。

Standard tMarkLogicBulkLoadコンポーネントはビッグデータファミリーとデータベースNoSQLファミリーのコンポーネントです。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Property Type] (プロパティタイプ)

[Built-In] (組み込み)または[Repository] (リポジトリー)のいずれか。

  • [Built-In] (組み込み): プロパティデータは一元的に保存されません。

  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。続くデータベース接続フィールドは、取得されたデータを使用して自動的に入力されます。

[Use an existing connection] (既存の接続の使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、『 Talend Studio ユーザーガイド』を参照してください。

[Host] (ホスト)

MarkLogicサーバーのIPアドレスまたはホスト名を入力します。

[Port] (ポート)

MarkLogicサーバーのリスニングポート番号を入力します。

[Database] (データベース)

使うMarkLogicデータベースの名前を入力します。

Username (ユーザー名)Password (パスワード)

MarkLogicデータベースにアクセスするためのユーザー認証データを入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

フォルダーのロード

MarkLogicデータベースにインポートするローカルファイルのディレクトリーを指定します。

DocId Prefixed As

インポートされたファイルのURIを構築するために使われるプレフィックスを指定します。URI構築の詳細は、https://docs.marklogic.com/guide/ingestion/content-pump#id_14982を参照してください。

詳細設定

追加のMLCPパラメーター

MLCPインポートコマンドの追加オプションを指定します。インポートオプションの詳細は、https://docs.marklogic.com/guide/ingestion/content-pump#id_63999を参照してください。

外部MLCPプロセスの使用

MarkLogic Content Pump (MLCP)プログラムは、このコンポーネントを含むジョブを実行するマシンで必須なため、次のいずれかを実行できるようになっています。

  • このコンポーネントを実行してデータをロードする時に組み込みのMLCPライブラリーを使うには、このチェックボックスをオフのままにします。この場合、ジョブは多くのメモリを必要とします。

  • 独自のMLCP、つまりStudioの外部のMLCPを使う必要がある場合は、このチェックボックスをオンにします。この場合、ジョブ自体は多くのメモリを必要としませんが、MLCPプロセスは多くのメモリを必要とします。

MLCPの詳細は、関連するMarklogicのドキュメントを参照してください: Loading Content Using Marklogic Content Pump

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントは、tMarkLogicInputコンポーネントと共に使って、ファイルが正しくインポートされたかどうかを確認できます。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データ構造が同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (動的設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスが選択されている場合にのみ使用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは使用できなくなります。

動的パラメーターの使用サンプルは、コンテキストベースの動的接続によるデータベースからのデータの読み取りおよび動的に読み込まれた接続パラメーターを使用した異なるMySQLデータベースからのデータの読み取りを参照してください。[Dynamic settings] (動的設定)とコンテキスト変数については、『Talend Studioユーザーガイド』を参照してください。

制限事項

MarkLogic Content Pump (MLCP)ツールは、このコンポーネントを含むジョブを実行するマシンにインストールする必要があります。