これらのプロパティは、[Standard] (標準)ジョブのフレームワークで実行されているtMongoDBInputを設定するために使われます。
[Standard] (標準)のtMongoDBInputコンポーネントは、ビッグデータファミリーとデータベースNoSQLファミリーに属しています。
このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで利用できます。
基本設定
[Use existing connection] (デフォルト接続を使用) |
定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。 |
[DB Version] (DBバージョン) |
データベースバージョンのリスト。 [Use existing connection] (既存の接続の使用)チェックボックスが選択されていない場合に使用できます。 |
[Use replica set address] (レプリカセットのアドレスの使用) |
このチェックボックスをオンにすると、[Replica address] (レプリカアドレス)テーブルが表示されます。 [Replica address] (レプリカアドレス)テーブルでは、フェイルオーバー用に複数のMongoDBデータベースサーバーを定義できます。 [Use existing connection] (既存の接続の使用)チェックボックスが選択されていない場合に利用できます。 |
[Server] (サーバー)と[Port] (ポート) |
データベースサーバーのIPアドレスとリスニングポート。 [Use existing connection] (既存の接続の使用)または[Use replica set address] (レプリカセットアドレスの使用)チェックボックスが選択されていない場合に使用できます。 |
[Database] (データベース) |
データベースの名前。 |
[Use SSL connection] (SSL接続を使用) |
SSLまたはTLS暗号化接続を有効にする場合は、このチェックボックスをオンにします。 次に、同じジョブ内のtSetKeystoreコンポーネントを使用して暗号化情報を指定する必要があります。 SSL接続はMongoDBのバージョン2.4 +でのみ利用可能です。 |
[Set read preference] (読み取り環境設定の設定) |
このチェックボックスをオンにして、[Read preference] (読み取り環境設定)ドロップダウンリストが表示されたら、読み取りオペレーションをダイレクトする必要のあるメンバーを選択します。 このチェックボックスをオフのままにすると、ジョブはデフォルトの読み取り環境設定を使用します。すなわち、レプリカセット内のプライマリーメンバーが使用されます。 詳細は、MongoDBのドキュメンテーションで複製とその読み取り環境設定に関する説明をご覧ください。 |
[Required authentication] (認証の要求) |
このチェックボックスをオンにすると、データベース認証が有効になります。 Kerberosを使用していない場合は、[Authentication mechanism] (認証メカニズム)ドロップダウンリストにリスト表示されているメカニズムのうち、[NEGOTIATE]が推奨されます。使用しているMongoDBバージョンに最もよく対応している認証メカニズムが自動的に選択されるためです。 このリスト内の他のメカニズムについては、MongoDBのドキュメンテーションでMongoDB Authenticationをご覧ください。 |
[Set Authentication database] (認証データベースの設定) |
MongoDBへの接続に使用するユーザー名がMongoDBの特定の認証データベース内で作成済みの場合は、このチェックボックスをオンにして、表示される[Authentication database] (認証データベース)フィールドに、この認証データベースの名前を入力します。 MongoDB認証データベースについては、User Authentication databaseをご覧ください。 |
[Username] (ユーザー名)と[Password] (パスワード) |
DBユーザー認証データ。 パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。 [Required authentication] (認証の要求)チェックボックスが選択されている場合に使用できます。 [Authentication mechanism] (認証方式)ドロップダウンリストでKerberosをセキュリティシステムに選択した場合は、[Username] (ユーザー名)と[Password] (パスワード)のフィールドではなく、[User principal] (プリンシパルを使用)、[Realm] (レルム)、[KDC server] (KDCサーバー)のフィールドに入力します。 |
[Collection] (コレクション) |
MongoDBデータベースのコレクションの名前。 |
[Schema] (スキーマ)および[Edit Schema] (スキーマを編集) (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
データベースのカラムがJSONドキュメントで、ドキュメント全体を読み取る必要がある場合は、引用符を使用せずに[DB column] (DBカラム)内でアスタリスク(*)を付けます。 |
[Query] (クエリー) |
クエリー条件を指定します。このフィールドは、[Query type] (クエリータイプ)ドロップダウンリストから[Find query] (クエリーを検索)を選択した場合のみ利用できます。 たとえば、[Collection] (コレクション)フィールドで指定したコレクションからidが4のレコードを取得するには、 注:
MongoDBクライアントソフトウェアの必須クエリーステートメントとは異なり、このクエリーは |
[Aggregation stages] (集計ステージ) |
ドキュメントが通過するステージを追加してMongoDB集計パイプラインを作成し、ドキュメントからの集計結果を取得します。このテーブルは、[Query type] (クエリータイプ)ドロップダウンリストから[Aggregation pipeline query] (集計パイプラインクエリー)を選択した場合のみ利用できます。 この[Aggregation stages] (集計ステージ)テーブルでは、1行につき1ステージのみが許可され、ステージはこのテーブルに配置した順序で1つずつ実行されます。 たとえば、$matchと$groupのステージを使用して顧客に関するドキュメントを集計する場合、この[Aggregation stages] (集計ステージ)テーブルに2つの行を追加し、以下の2つのステージを定義します:
この集計では、ステータスAの顧客ドキュメントが選択されます。その後、選択された顧客の中で同じ顧客IDでグルーピングされ、同じ顧客の[amount] (金額)フィールドの値が合計されます。 使用できるステージと関連する演算子の完全なリストは、Aggregation pipeline operatorsをご覧ください。 MongoDB集計パイプラインの詳細は、『集計パイプライン』を参照してください。 |
[Mapping] (マッピング) |
このコンポーネント用に定義されたスキーマの各カラムは、読み取るドキュメントのフィールドを表します。このテーブルで、これらのフィールドの親ノードがあればそれを指定する必要があります。 たとえば、次のようなドキュメントがあるとします。
{ _id: ObjectId("5099803df3f4948bd2f98391"), person: { first: "Joe", last: "Walker" } }フィールドfirstおよびlastには親ノードpersonがありますが、_idフィールドには親ノードがありません。したがって、完了すると、この[Mapping]テーブルは次のようになります。 Column Parent node path _id first "person" last "person" |
[Sort by] (ソート条件) |
カラムを指定し、並べ替え操作の順序を選択します。 このフィールドは、[Query type] (クエリータイプ)ドロップダウンリストから[Find query] (クエリーを検索)を選択した場合にのみ使用できます。 |
[Limit] (制限事項) |
取得するレコードの最大数を入力します。 このフィールドは、[Query type] (クエリータイプ)ドロップダウンリストから[Find query] (クエリーを検索)を選択した場合にのみ使用できます。 |
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。 |
[No query timeout] (クエリータイムアウトなし) |
アイドルカーソルの非アクティブ状態が10分間続いた時にMongoDBサーバーがカーソルを停止することを防ぐには、このチェックボックスをオンにします。この状況では、このカーソルの結果が枯渇するか、または MongoDBのカーソルはクエリーの結果セットを指すポインターです。デフォルトでは、すなわち、このチェックボックスがオフの場合、MongoDBサーバーは、メモリの過剰使用を避けるために、非アクティブ状態が特定の期間続くと、アイドルカーソルを自動的に停止します。MongoDBカーソルの詳細は、https://docs.mongodb.org/manual/core/cursors/をご覧ください。 |
[Global Variables] (グローバル変数)
[Global Variables] (グローバル変数) |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合のみ機能します。 Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、 Talend Studio ユーザーガイドをご覧ください。 |
使用方法
[Usage rule] (使用ルール) |
tMongoDBInputは、開始コンポーネントとしてMongoDBデータベースのコレクションからレコードを取得し、後続コンポーネントに転送して表示または保存します。 |