tMarkLogicOutput標準プロパティ - 7.2

MarkLogic

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MarkLogic
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MarkLogic

このプロパティはStandardジョブフレームワークで実行されているtMarkLogicOutputを設定するために使います。

Standard tMarkLogicOutputコンポーネントはビッグデータファミリーとデータベースNoSQLファミリーのコンポーネントです。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Property Type] (プロパティタイプ)

[Built-In] (組み込み)または[Repository] (リポジトリー)のいずれか。

  • [Built-In] (組み込み): プロパティデータは一元的に保存されません。

  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。続くデータベース接続フィールドは、取得されたデータを使用して自動的に入力されます。

[Use an existing connection] (既存の接続の使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベルをまたがってデータベース接続を共有する方法の例は、『 Talend Studio ユーザーガイド』を参照してください。

[Host] (ホスト)

MarkLogicサーバーのIPアドレスまたはホスト名を入力します。

[Port] (ポート)

MarkLogicサーバーのリスニングポート番号を入力します。

[Database] (データベース)

使うMarkLogicデータベースの名前を入力します。

Username (ユーザー名)Password (パスワード)

MarkLogicデータベースにアクセスするためのユーザー認証データを入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

認証

リストからDIGESTまたはBASICのいずれかの認証タイプを選択します 。認証のタイプの詳細は、http://docs.marklogic.com/guide/security/authentication#id_56266を参照してください。

アクション

実行する操作を選択します。

  • [UPSERT] (アップサート): 既存のドキュメントのコンテンツを更新するか、存在しない場合はドキュメントを作成します。

  • [PATCH] (パッチ): ドキュメントのコンテンツに部分的な更新を実行します。

  • [DELETE] (削除): 入力フローに対応するドキュメントを削除します。

[Action] (アクション)リストで[DELETE] (削除)が選択されている場合、入力スキーマには、削除するドキュメントのURIを記述する1つのカラムdocIdが含まれている必要があります。他のカラムがあっても無視されます。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

このコンポーネントのスキーマは読み取り専用です。[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックすると、次の2つのカラムを含む事前定義済みのスキーマが表示されます。
  • docId: ドキュメントのURI。

  • docContent: ドキュメントのコンテンツ。

詳細設定

ドキュメントタイプ

処理するドキュメントのタイプを選択します: [MIXED] (混在)[PLAIN TEXT] (プレーンテキスト)JSONXML、または[BINARY] (バイナリ)

自動生成ドキュメントID

このチェックボックスをオンにすると、ドキュメントURIが自動的に生成され、表示される[Doc Id Prefix] (ドキュメントIDプレフィックス)フィールドに、ドキュメントURIの構築に使われるプレフィックスが入力されます。

このチェックボックスは、[Action] (アクション) リストから[UPSERT] (アップサート)が選択されており、[Doc Type] (ドキュメントタイプ)リストから[MIXED] (混在)が選択されていない場合にのみ使えます。

  • このチェックボックスがオンの場合、入力スキーマにはドキュメントのコンテンツを記述する1つのカラムdocContentが含まれている必要があります。他の列があっても無視されます。

  • このチェックボックスがオフの場合、入力スキーマには、ドキュメントのURIとドキュメントのコンテンツをそれぞれ記述する2つのカラムdocIddocContentが含まれている必要があります。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントは通常、終了コンポーネントとして使われ、常に入力フローが必要です。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データ構造が同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (動的設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスが選択されている場合にのみ使用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは使用できなくなります。

動的パラメーターの使用サンプルは、コンテキストベースの動的接続によるデータベースからのデータの読み取りおよび動的に読み込まれた接続パラメーターを使用した異なるMySQLデータベースからのデータの読み取りを参照してください。[Dynamic settings] (動的設定)とコンテキスト変数については、『Talend Studioユーザーガイド』を参照してください。