tMarkLogicInputの標準プロパティ - 7.3

MarkLogic

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
Last publication date
2024-02-22

これらのプロパティは、標準ジョブのフレームワークで実行されているtMarkLogicInputを設定するために使われます。

標準tMarkLogicInputコンポーネントは、ビッグデータファミリーとデータベースNoSQLファミリーに属しています。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで利用できます。

基本設定

[Property Type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

  • [Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。

  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。続くデータベース接続フィールドは、取得されたデータを使用して自動的に入力されます。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベル全体でデータベース接続を共有する方法の例は、Talend Studioユーザーガイドをご覧ください。

[Host] (ホスト)

MarkLogicサーバーのIPアドレスまたはホスト名を入力します。

[Port] (ポート)

MarkLogicサーバーのリスニングポート番号を入力します。

[Database] (データベース)

使うMarkLogicデータベースの名前を入力します。

Username (ユーザー名)Password (パスワード)

MarkLogicデータベースにアクセスするためのユーザー認証データを入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。

認証

リストからDIGESTまたはBASICのいずれかの認証タイプを選択します 。認証のタイプの詳細は、http://docs.marklogic.com/guide/security/authentication#id_56266をご覧ください。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

このコンポーネントのスキーマは読み取り専用です。[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックすると、次の2つのカラムを含む事前定義済みのスキーマが表示されます。
  • docId: ドキュメントのURI。

  • docContent: ドキュメントのコンテンツ。

クエリー条件

検索の基準となる文字列クエリーを指定します。文字列クエリーの詳細は、https://docs.marklogic.com/guide/search-dev/string-queryをご覧ください。

詳細設定

最大取得数

取得するドキュメントの最大数を入力します。

クエリーオプションの使用

クエリーオプションでクエリーをカスタマイズするには、このチェックボックスをオンにします。クエリーオプションはRESTサーバーに保管され、他のクエリーから名前で参照できます。クエリーオプションについては、http://docs.marklogic.com/guide/java/query-options#id_20346をご覧ください。

[Query Literal Type] (クエリーリテラルタイプ): クエリーオプションの作成元となるプレゼンテーションのタイプを選択します 。XMLまたはJSONのいずれかです。

[Query Option Name] (クエリーオプション名): クエリーオプションの名前を指定します。

[Query Option Literals] (クエリーオプションリテラル}: 選択した表現タイプに従って、rawのXMLまたはJSON表現からクエリーオプションを実装します。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

グローバル変数

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、通常、開始コンポーネントとして使われ、出力フローを必要とします。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。

ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。