メイン コンテンツをスキップする 補完的コンテンツへスキップ

tMongoDBGridFSPropertiesの標準プロパティ

これらのプロパティは、標準ジョブのフレームワークで実行されているtMongoDBGridFSPropertiesを設定するために使われます。

標準tMongoDBGridFSPropertiesコンポーネントは、ビッグデータファミリーとデータベースNoSQLファミリーに属しています。

このフレームワークのコンポーネントは、すべてのビッグデータ対応のTalend製品およびTalend Data Fabricで使用できます。

基本設定

[Property type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。

[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。

[Use existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。

ジョブに親ジョブと子ジョブが含まれている場合、[Component List] (コンポーネントリスト)には同じジョブレベルの接続コンポーネントのみが表示されます。

[DB Version] (DBバージョン)

データベースバージョンのリスト。

[Use existing connection] (既存の接続を使用)チェックボックスが選択されていない場合に利用できます。

[Use connection string] (接続文字列を使用)

このオプションを選択すると、MongoDB Atlas URIを使って接続を確立できます。右側のフィールドにURIを入力します。関連情報は、接続文字列のURI形式をご覧ください。

このオプションは、[DB Version] (DBバージョン)ドロップダウンリストからMongoDB 4.4.X and laterを選択する場合に利用できます。

情報メモ注: このオプションは、Talendが提供するR2021-12以降のStudio Talendマンスリーアップデートをインストール済みである場合のみ利用できます。詳細は管理者にお問い合わせください。

[Use replica set address or multiple query routers] (レプリカセットのアドレスまたは複数クエリールーターを使用します)

このチェックボックスをオンにして[Server addresses] (サーバーアドレス)テーブルを表示します。

[Server addresses] (サーバーアドレス)テーブルで、接続先とする共有のMongoDBデータベースまたはMongoDBレプリカセットを定義します。

[Server] (サーバー)[Port] (ポート)

データベースサーバーのIPアドレスとリスニングポート。

[Use replica set address] (レプリカセットアドレス)を使用するチェックボックスが選択されていない場合に利用できます。

認証メカニズムを使用してこのMongoDBデータベースに接続する場合は、IPアドレスではなく、データベースサーバーのホスト名を入力する必要があります。

[Database] (データベース)

データベースの名前。

[Use SSL connection (Configure the SSL authentication in tSetKeystore or in Studio preferences)] (SSL接続を使用(tSetKeystoreまたはStudio設定でSSL認証を構成))

SSLまたはTLS暗号化接続を有効にする場合は、このチェックボックスを選択します。

次に、同じジョブ内のtSetKeyStoreコンポーネントを使用して暗号化情報を指定する必要があります。

SSL接続はMongoDBのバージョン2.4 +でのみ利用可能です。

[Set read preference] (読み取り環境設定の設定)

このチェックボックスをオンにして、[Read preference] (読み取り環境設定)ドロップダウンリストが表示されたら、読み取りオペレーションをダイレクトする必要のあるメンバーを選択します。

このチェックボックスをオフのままにすると、ジョブはデフォルトの読み取り環境設定を使用します。すなわち、レプリカセット内のプライマリーメンバーが使用されます。

詳細は、MongoDBのドキュメンテーションで複製とその読み取り環境設定に関する説明をご覧ください。

認証の利用

このチェックボックスをオンにすると、データベース認証が有効になります。

Kerberosを使用していない場合は、[Authentication mechanism] (認証メカニズム)ドロップダウンリストにリスト表示されているメカニズムのうち、[NEGOTIATE]が推奨されます。使用しているMongoデータベースバージョンに最もよく対応している認証メカニズムが自動的に選択されるためです。

SCRAM-SHA-256認証メカニズムがMongoDB 4.x以降のみにサポートされているため、SCRAM-SHA-256 SASLオプションは[DB Version] (データベースバージョン)ドロップダウンリストから、MongoDB 4.4.X and laterが選択されている時のみ利用できます。

情報メモ注: X509オプションは、Talendが提供するR2021-12以降のStudio Talendマンスリーアップデートをインストール済みである場合のみ利用できます。詳細は管理者にお問い合わせください。

このリスト内の他のメカニズムについては、MongoDBのドキュメンテーションでMongoDB Authenticationをご覧ください。

[Set Authentication database] (認証データベースの設定)

MongoDBへの接続に使用するユーザー名がMongoDBの特定の認証データベース内で作成済みの場合は、このチェックボックスをオンにして、表示される[Authentication database] (認証データベース)フィールドに、この認証データベースの名前を入力します。

MongoDB認証データベースについては、User Authentication databaseをご覧ください。

[Username] (ユーザー名)[Password] (パスワード)

DBユーザー認証データ。

パスワードを入力するためには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符で囲んで入力して[OK]をクリックし、設定を保存します。

[Required authentication] (必要な認証)チェックボックスが選択されている場合に利用できます。

[Authentication mechanism] (認証方式)ドロップダウンリストから、Kerberosをセキュリティシステムに選択した場合は、[Username] (ユーザー名)[Password] (パスワード)のフィールドではなく、[User principal] (プリンシパルを使用)[Realm] (レルム)[KDC server] (KDCサーバー)のフィールドに入力します。

[Bucket] (バケット)

使用するファイルを格納するバケットの名前を入力します。GridFSのバケットはフォルダに似ています。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

tMongoDBGridFSPropertiesの事前定義済みスキーマのカラムはGridFSファイルのデフォルト属性を表しますが、カラム名は既に属性名と同一になっています。
  • データフローから一部の属性を除外してジョブで処理されないようにするには、これらの属性に相当するカラムをこのスキーマから削除できます。

  • 使用するカラムの名前は変更しないでください。それぞれのカラムの名前は、その名前が表すファイル属性の名前と同一であることが必要です。

  • 処理するファイルに、抽出したいカスタム属性が含まれている場合は、その名前が表すカラムを適宜追加し、これらのカラムとカスタム属性に必ず同一の名前を使用します。

[Query type] (クエリータイプ)

tMongoDBGridFSPropertiesで実行するクエリーのタイプを選択して、属性を抽出する必要のあるファイルを選択します。

  • [Filename] (ファイル名):ファイルの名前を入力する必要があります。この名前は、このファイルのfilename属性の値です。1つの名前のみが許可されます。

    GridFSでは、ファイルはその一意の識別子(オブジェクトID)によってのみ識別されます。そのファイル名は必ずしも一意ではありません。

  • [Mongo Query] (Mongoクエリー):使用するファイルを選択するために使用するクエリーを入力します。

    tMongoDBGridFSPropertiesで提供される二重引用符内の{}クエリーの例は、バケット内のすべてのファイルを選択することを意味します。{'filename':{'$ regex': 'REGEX_PATTERN'}}を指定して、使用するファイル名の定義に正規表現を適用できます。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。

[No query timeout] (クエリータイムアウトなし)

アイドルカーソルの非アクティブ状態が10分間続いた時にMongoデータベースサーバーがカーソルを停止することを防ぐ場合は、このチェックボックスを選択します。この状況では、このカーソルの結果が枯渇するか、またはcursor.close()方式を使用して手動で閉じるまで、アイドルカーソルが開いたままとなります。

MongoDBのカーソルはクエリーの結果セットを指すポインターです。デフォルトでは、すなわち、このチェックボックスがオフの場合、Mongoデータベースサーバーは、メモリの過剰使用を避けるために、非アクティブ状態が特定の期間続くと、アイドルカーソルを自動的に停止します。MongoDBカーソルの詳細は、https://docs.mongodb.org/manual/core/cursors/をご覧ください。

グローバル変数

グローバル変数

NB_FILE: 処理されたファイルの数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。

変数の詳細は、コンテキストと変数を使用をご覧ください。

使用方法

使用ルール

このコンポーネントは、MongoDB GridFS接続とデータ抽出を組み合わせており、このコンポーネントにデータを送信するには、[Main] (メイン)リンクを使用して次のコンポーネントに接続する必要があります。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。