tMapROjaiOutput標準プロパティ - Cloud - 8.0

MapRDB

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MapRDB
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MapRDB
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MapRDB

このプロパティはStandardジョブフレームワークで実行されているtMapROjaiOutputを設定するために使います。

[Standard] (標準) tMapROjaiOutputコンポーネントは、データベースNoSQLファミリーに属しています。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Distribution] (ディストリビューション)[Version] (バージョン)

MapRクラスターのバージョンを選択します。このクラスターは、使用するMapR-DBデータベースをホストしている必要があります。

[Schema] (スキーマ)および[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

  • [Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。
注: 変更を加えると、スキーマは自動的に組み込みになります。
  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

このコンポーネントはドキュメントタイプをサポートしています。ドキュメント全体に対してフィールドがある場合は、スキーマエディターで、このフィールドの[Type] (タイプ)カラムの[Document] (ドキュメント)を選択します。

ジョブで接続されている先行コンポーネントからスキーマを取得するには、[Sync columns] (カラムの同期)をクリックします。

[Use Kerberos authentication] (Kerberos認証を使用)

Kerberosセキュリティを実行しているOJAIデータベースとしてのMapR-DBにアクセスする場合は、このチェックボックスをオンにし、表示されたフィールドにKerberosのプリンシパル名とパスワードを入力します。

ジョブを起動するたびに、新しいkinitチケットを得るため、コンポーネントによってこの認証情報がKerberosに送信されます。

  • Kerberosと共にMapRチケットセキュリティメカニズムも設定すると、MapRチケットを同時に取得するため、このコンポーネントによってmapr loginコマンドが発行されます。

  • クラスターでMapRチケットセキュリティメカニズムだけを設定し、Kerberosを設定しない場合は、このチェックボックスをオフにします。このコンポーネントは、MapRクライアントからMapRチケット自体を取得します。

[Use a keytab to authenticate] (Keytabを認証に使用)

[Use a keytab to authenticate] (Keytabを認証に使用)チェックボックスをオンにして、所定のkeytabファイルを使ってKerberos対応のシステムにログインします。keytabファイルには、Kerberosのプリンシパルと暗号化されたキーのペアが含まれています。使用するプリンシパルを[Principal] (プリンシパル)フィールドに入力し、keytabファイルへのアクセスパスを[Keytab] フィールドに入力します。このkeytabファイルは、ジョブが実際に実行されているマシン、たとえば、Talend Jobserverに保存する必要があります。

keytabが有効なジョブは、プリンシパルに任命されたユーザーでなくても実行できますが、使用するkeytabファイルの読み取り権限が必要です。たとえば、user1というユーザー名でジョブを実行し、使用するプリンシパルがguestの場合、user1に使用するkeytabファイルの読み取り権限があることをご確認ください。

[Table] (テーブル)

処理するテーブルの名前を入力します。

[Action on table] (テーブルの操作)

定義されたテーブルに対して実行する操作を選択します。

  • [None] (なし): 操作は行われません。

  • [Drop and create table] (テーブルの削除と作成): テーブルが削除され、再作成されます。

  • [Create table] (テーブルの作成): テーブルが存在しないため、作成します。

  • [Create table if not exists] (存在しない場合はテーブルを作成): テーブルが存在しない場合は作成されます。

  • [Drop table if exist and create] (存在する場合はテーブルを削除して作成): テーブルが既に存在する場合は削除されて、再作成されます。

  • [Truncate] (切り捨て): テーブルの内容が削除されます。

[Action on data] (データへのアクション)

定義されたテーブルのデータに対して実行する操作を選択します。

  • [Insert] (挿入): テーブルに新しいエントリ-が追加されます。重複が見つかると、ジョブは停止します。

  • [Replace] (置換): テーブルに既にデータが含まれている場合は、既存のデータはすべて削除され、新しいデータが挿入されます。テーブルが空の場合は、新しいデータが挿入されます。

  • [Insert or Replace] (挿入または置換): ドキュメントIDを調べて、データベースと書き込まれるデータの両方にIDが存在するドキュメントは置換し、データベースにIDが存在しないドキュメントは挿入します。

  • [Delete] (削除): 入力フローに対応するエントリーを削除します。

[Bulk write] (バルク書き込み)

データを一括で挿入、更新、または削除するには、このチェックボックスをオンにします。

[Bulk write size] (一括書き込みサイズ)フィールドに、MapR-DBによって処理する各クエリーグループのサイズを入力します。

Mapping (マッピング)

このコンポーネント用に定義されたスキーマの各カラムは、読み取るドキュメントのフィールドを表します。このテーブルで、これらのフィールドの親ノードがあればそれを指定する必要があります。

たとえば、次のようなドキュメントがあるとします。
{
               _id: ObjectId("5099803df3f4948bd2f98391"),
               person: { first: "Joe", last: "Walker" }
            }
フィールドfirstおよびlastには親ノードpersonがありますが、_idフィールドには親ノードがありません。したがって、完了すると、この[Mapping]テーブルは次のようになります。
Column     Parent node path
_id
first       "person"
last        "person"

[Die on error] (エラー発生時に強制終了)

このチェックボックスをオンにすると、エラー時に行をスキップし、エラーの発生していない行の処理が完了されます。デフォルトでは選択されていません。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

NB_LINE_REJECTED: 拒否された行の数。これはAfter変数で、整数を返します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

tMapROjaiOutputは、ジョブ内の前のコンポーネントから受信したフローに基づいて、特定のMapR-DBデータベース内のドキュメントで定義されたアクションを実行します。