tMongoDBGridFSGet標準プロパティ - 7.3

MongoDB

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MongoDB

このプロパティはStandardジョブフレームワークで実行されているtMongoDBGridFSGetを設定するために使います。

Standard tMongoDBGridFSGetコンポーネントはビッグデータファミリーとデータベースNoSQLファミリーのコンポーネントです。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Property type] (プロパティタイプ)

[Built-In] (組み込み)または[Repository] (リポジトリー)のいずれか。

[Built-In] (組み込み): プロパティデータは一元的に保存されません。

[Repository] (リポジトリー): プロパティを保存するリポジトリーファイルを選択します。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストで目的の接続コンポーネントを選択します。

ジョブに親ジョブと子ジョブが含まれている場合、[Component List] (コンポーネントリスト)には同じジョブレベルの接続コンポーネントのみが表示されます。

[Use replica set address or multiple query routers] (レプリカセットのアドレスまたは複数クエリールーターを使用します)

このチェックボックスをオンにして[Server addresses] (サーバーアドレス)テーブルを表示します。

[Server addresses] (サーバーアドレス)テーブルで、接続先とするシャードMongoDBデータベースまたはMongoDBレプリカセットを定義します。

[Server] (サーバー)[Port] (ポート)

データベースサーバーのIPアドレスとリスニングポート。

[Use replica set address] (レプリカセットアドレス)を使用するチェックボックスが選択されていない場合に使用できます。

認証メカニズムを使用してこのMongoDBデータベースに接続する場合は、IPアドレスではなく、データベースサーバーのホスト名を入力する必要があります。

[Database] (データベース)

データベースの名前。

[Use SSL connection] (SSL接続の使用)

SSLまたはTLS暗号化接続を有効にする場合は、このチェックボックスをオンにします。

次に、同じジョブ内のtSetKeystoreコンポーネントを使用して暗号化情報を指定する必要があります。

SSL接続はMongoDBのバージョン2.4 +でのみ利用可能です。

[Set read preference] (読み取り環境設定の設定)

このチェックボックスをオンにして、[Read preference] (読み取り環境設定)ドロップダウンリストが表示されたら、読み取りオペレーションをダイレクトする必要のあるメンバーを選択します。

このチェックボックスをオフのままにすると、ジョブはデフォルトの読み取り環境設定を使用します。すなわち、レプリカセット内のプライマリーメンバーが使用されます。

詳細は、MongoDBのドキュメンテーションで複製とその読み取り環境設定に関する説明を参照してください。

[Required authentication] (認証の要求)

このチェックボックスをオンにすると、データベース認証が有効になります。

Kerberosを使用していない場合は、[Authentication mechanism] (認証メカニズム)ドロップダウンリストにリスト表示されているメカニズムのうち、[NEGOTIATE]が推奨されます。使用しているMongoDBバージョンに最もよく対応している認証メカニズムが自動的に選択されるためです。

SCRAM-SHA-256認証メカニズムがMongoDB 4.x以降のみにサポートされているため、SCRAM-SHA-256 SASLオプションは[DB Version] (DBバージョン)ドロップダウンリストからMongoDB 4.4.X and laterが選択されている時のみ利用できます。
注: SCRAM-SHA-256 SASLオプションは、TalendのR2021-08以降のStudio月次アップデートをインストールした時のみ利用できます。詳細は管理者にお問い合わせください。

このリスト内の他のメカニズムについては、MongoDBのドキュメンテーションでMongoDB Authenticationを参照してください。

[Set Authentication database] (認証データベースの設定)

MongoDBへの接続に使用するユーザー名がMongoDBの特定の認証データベース内で作成済みの場合は、このチェックボックスをオンにして、表示される[Authentication database] (認証データベース)フィールドに、この認証データベースの名前を入力します。

MongoDB認証データベースについては、User Authentication databaseを参照してください。

[Username] (ユーザー名)[Password] (パスワード)

DBユーザー認証データ。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

[Required authentication] (認証の要求)チェックボックスが選択されている場合に使用できます。

[Authentication mechanism] (認証方式)ドロップダウンリストでKerberosをセキュリティシステムに選択した場合は、[Username] (ユーザー名)[Password] (パスワード)のフィールドではなく、[User principal] (プリンシパルを使用)[Realm] (レルム)[KDC server] (KDCサーバー)のフィールドに入力します。

Bucket (バケット)

ファイルを読み取る必要があるバケットの名前を入力します。GridFSのバケットはフォルダに似ています。

[Query type] (クエリータイプ)

tMongoDBGridFSGetで実行するクエリーのタイプを選択して、コピーするデータを選択します。

  • [Filename] (ファイル名): コピーするファイルの名前を入力する必要があります。この名前は、このファイルで使用されるfilename属性の値です。1つの名前のみが許可されます。

    GridFSでは、ファイルはその一意の識別子(オブジェクトID)によってのみ識別されます。そのファイル名は必ずしも一意ではありません。

  • [Mongo Query] (Mongoクエリー): コピーするファイルを選択するために使用するクエリーを入力します。

    このコンポーネントで提供されている二重引用符で囲まれたデフォルトクエリー{}は、すべてのファイルを選択することを意味します。{'filename':{'$regex':'REGEX_PATTERN'}}を使用することで正規表現を適用し、使用するファイル名を定義することもできます。

ファイル名の競合の問題を回避するために、[Overwrite local files] (ローカルファイルを上書き)および[Use Document ID as output filename] (ドキュメントIDを出力ファイル名として使用)チェックボックスとともにクエリーを使用することをお勧めします。

[Local Folder] (ローカルフォルダー)

GridFSからコピーしたデータを書き込むフォルダーへのパスを入力します。

[Overwrite local files] (ローカルファイルを上書き)

使用しているローカルフォルダ内の同じファイル名を使用してファイルを上書きするには、このチェックボックスをオンにします。オフの場合、このタイプの状況では例外が返されます。

[Use Document ID as output filename] (ドキュメントIDを出力ファイル名として使用)

オブジェクトIDの値を使用して、受信ファイルの名前をオンザフライで変更するには、このボックスを選択します。これにより、同じファイル名を持つファイルを保持できます。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

[No query timeout] (クエリータイムアウトなし)

アイドルカーソルの非アクティブ状態が10分間続いた時にMongoDBサーバーがカーソルを停止することを防ぐには、このチェックボックスをオンにします。この状況では、このカーソルの結果が枯渇するか、またはcursor.close()メソッドを使用して手動で閉じるまで、アイドルカーソルが開いたままとなります。

MongoDBのカーソルはクエリーの結果セットを指すポインターです。デフォルトでは、すなわち、このチェックボックスがオフの場合、MongoDBサーバーは、メモリの過剰使用を避けるために、非アクティブ状態が特定の期間続くと、アイドルカーソルを自動的に停止します。MongoDBカーソルの詳細は、https://docs.mongodb.org/manual/core/cursors/を参照してください。

[Global Variables] (グローバル変数)

[Global Variables] (グローバル変数)

NB_FILE: 処理されたファイルの数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントはMongoDB GridFS接続とデータ抽出を組み合わせます。したがって通常は、ユーザーが定義したローカルディレクトリーへGridFSからデータをコピーするために単一コンポーネントサブジョブとして使われます。

ほとんどの場合、コンテキストに応じて、OnSubjobOkまたはOnComponentOkリンクを使ってジョブに接続します。