tMap標準プロパティ - Cloud - 8.0

MapRDB

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MapRDB
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MapRDB
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MapRDB

このプロパティはStandardジョブフレームワークで実行されているtMapROjaiInputを設定するために使います。

[Standard] (標準) tMapROjaiInputコンポーネントは、データベースNoSQLファミリーに属しています。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Distribution] (ディストリビューション)[Version] (バージョン)

MapRクラスターのバージョンを選択します。このクラスターは、使用するMapR-DBデータベースをホストしている必要があります。

[Schema] (スキーマ)および[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

  • [Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。
注: 変更を加えると、スキーマは自動的に組み込みになります。
  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

このコンポーネントはドキュメントタイプをサポートしています。ドキュメント全体に対してフィールドがある場合は、スキーマエディターで、このフィールドの[Type] (タイプ)カラムの[Document] (ドキュメント)を選択します。

ジョブで接続されている先行コンポーネントからスキーマを取得するには、[Sync columns] (カラムの同期)をクリックします。

[Use Kerberos authentication] (Kerberos認証を使用)

Kerberosセキュリティを実行しているOJAIデータベースとしてのMapR-DBにアクセスする場合は、このチェックボックスをオンにし、表示されたフィールドにKerberosのプリンシパル名とパスワードを入力します。

ジョブを起動するたびに、新しいkinitチケットを得るため、コンポーネントによってこの認証情報がKerberosに送信されます。

  • Kerberosと共にMapRチケットセキュリティメカニズムも設定すると、MapRチケットを同時に取得するため、このコンポーネントによってmapr loginコマンドが発行されます。

  • クラスターでMapRチケットセキュリティメカニズムだけを設定し、Kerberosを設定しない場合は、このチェックボックスをオフにします。このコンポーネントは、MapRクライアントからMapRチケット自体を取得します。

[Use a keytab to authenticate] (Keytabを認証に使用)

[Use a keytab to authenticate] (Keytabを認証に使用)チェックボックスをオンにして、所定のkeytabファイルを使ってKerberos対応のシステムにログインします。keytabファイルには、Kerberosのプリンシパルと暗号化されたキーのペアが含まれています。使用するプリンシパルを[Principal] (プリンシパル)フィールドに入力し、keytabファイルへのアクセスパスを[Keytab] フィールドに入力します。このkeytabファイルは、ジョブが実際に実行されているマシン、たとえば、Talend Jobserverに保存する必要があります。

keytabが有効なジョブは、プリンシパルに任命されたユーザーでなくても実行できますが、使用するkeytabファイルの読み取り権限が必要です。たとえば、user1というユーザー名でジョブを実行し、使用するプリンシパルがguestの場合、user1に使用するkeytabファイルの読み取り権限があることをご確認ください。

[Restrict partial sorts with Secondary Indexes] (部分ソートをセカンダリーインデックスで制限)

このチェックボックスをオンにすると、実際のデータでクエリーが明示的に並べ替えられます。これにより、クエリー内で非同期セカンダリーインデックスが原因で発生する可能性がある部分的な並べ替えを回避できます。

MapR OJAIのこの部分的な並べ替えの問題については、MapRドキュメントの非同期セカンダリーインデックスの更新を参照してください。

非同期インデックスで遅延が発生しないと予想される場合、または遅延の影響が軽微であることがわかっている場合は、このチェックボックスをオンにしないでください。このチェックボックスをオフにしておくことで、クエリーはMapR-DB JSONテーブルのセカンダリーインデックスによって提供される順序付けの利点を活用できます。

テーブル名

処理するテーブルの名前を入力します。

クエリー

tMapROjaiInputによって実行されるクエリーのwhere句を指定します。

たとえば、"{id:{$eq: 4}}"または"{id:4}}"と入力して、id4となっているレコードを取得します。

OJAIはクエリーにMongoDBクエリー形式を使うため、使用可能な演算子については、MongoDBドキュメントのクエリー演算子を参照してください。

Mapping (マッピング)

このコンポーネント用に定義されたスキーマの各カラムは、読み取るドキュメントのフィールドを表します。このテーブルで、これらのフィールドの親ノードがあればそれを指定する必要があります。

たとえば、次のようなドキュメントがあるとします。
{
               _id: ObjectId("5099803df3f4948bd2f98391"),
               person: { first: "Joe", last: "Walker" }
            }
フィールドfirstおよびlastには親ノードpersonがありますが、_idフィールドには親ノードがありません。したがって、完了すると、この[Mapping]テーブルは次のようになります。
Column     Parent node path
_id
first       "person"
last        "person"

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

tMapROjaiInputはクエリーを実行して、指定されたMapR-DBデータベースからデータを読み取ります。これはジョブの開始コンポーネントであり、次のコンポーネントにデータを送信するには送信リンクが必要です。