tMarkLogicBulkLoadの標準プロパティ - 7.3

MarkLogic

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
Last publication date
2024-02-22

これらのプロパティは、標準ジョブのフレームワークで実行されているtMarkLogicBulkLoadを設定するために使われます。

標準tMarkLogicBulkLoadコンポーネントは、ビッグデータファミリーとデータベースNoSQLファミリーに属しています。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで利用できます。

基本設定

[Property Type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

  • [Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。

  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。続くデータベース接続フィールドは、取得されたデータを使用して自動的に入力されます。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベル全体でデータベース接続を共有する方法の例は、Talend Studioユーザーガイドをご覧ください。

[Host] (ホスト)

MarkLogicサーバーのIPアドレスまたはホスト名を入力します。

[Port] (ポート)

MarkLogicサーバーのリスニングポート番号を入力します。

[Database] (データベース)

使うMarkLogicデータベースの名前を入力します。

Username (ユーザー名)Password (パスワード)

MarkLogicデータベースにアクセスするためのユーザー認証データを入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。

フォルダーのロード

MarkLogicデータベースにインポートするローカルファイルのディレクトリーを指定します。

DocId Prefixed As

インポートされたファイルのURIを構築するために使われるプレフィックスを指定します。URI構築の詳細は、https://docs.marklogic.com/guide/ingestion/content-pump#id_14982をご覧ください。

詳細設定

追加のMLCPパラメーター

MLCPインポートコマンドの追加オプションを指定します。インポートオプションの詳細は、https://docs.marklogic.com/guide/ingestion/content-pump#id_63999をご覧ください。

外部MLCPプロセスの使用

MarkLogic Content Pump (MLCP)プログラムは、このコンポーネントを含むジョブを実行するマシンで必須なため、次のいずれかを実行できるようになっています。

  • このコンポーネントを実行してデータをロードする時に組み込みのMLCPライブラリーを使うには、このチェックボックスをオフのままにします。この場合、ジョブは多くのメモリを必要とします。

  • 独自のMLCP、つまりStudioの外部のMLCPを使う必要がある場合は、このチェックボックスをオンにします。この場合、ジョブ自体は多くのメモリを必要としませんが、MLCPプロセスは多くのメモリを必要とします。

MLCPの詳細は、関連するMarklogicのドキュメントをご覧ください: Loading Content Using Marklogic Content Pump

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

グローバル変数

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、tMarkLogicInputコンポーネントと共に使って、ファイルが正しくインポートされたかどうかを確認できます。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。

ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。

制限事項

MarkLogic Content Pump (MLCP)ツールは、このコンポーネントを含むジョブを実行するマシンにインストールする必要があります。