ジョブを設定 - Cloud - 8.0

MongoDB

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MongoDB

手順

  1. tMongoDBConnection_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、MongoDB接続の確立に必要な情報をすべて入力します。
  2. tFixedFlowInput_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Edit schema] (スキーマを編集)の横にある[...]をクリックし、スキーマに_id (文字列型)、name (文字列型)、address (文字列型)、age (数値型)、birth (日付型および"yyyy-MM-dd"というパターン)というカラムを追加します。
    2. [Use Inline Table] (インラインテーブルを使用)を選択し、[Inline Table] (インラインテーブル)フィールドに次のように入力します。
      "101" "name1" "beijing" 21 2017-01-11
      "102" "name2" "shanghai" 22 2017-01-12
    3. 他のオプションはそのままにしておきます。
    このコンポーネントによって、レコードフィールド、およびシナリオの2つのレコードが定義されます。
  3. tMongoDBOutput_1をダブルクリックして[Basic settings] (基本設定)ビューを開き、次の操作を行います。
    1. [Use existing connection] (既存の接続を使用)を選択し、[Component List] (コンポーネントリスト)ドロップダウンリストでtMongoDBConnection_1を選択します。
    2. [Collection] (コレクション)フィールドに、レコードの書き込み先となるコレクションの名前(このシナリオではTDI44990_1)を入力します。
    3. [Action on data] (データでのアクション)ドロップダウンリストで[Insert] (挿入)を選択します。
    4. [Sync columns] (カラムを同期)ボタンをクリックし、このコンポーネントのスキーマがtFixedFlowInputコンポーネントのものと同じカラムであることを確認します。
      [Mapping] (マッピング) テーブルにtFixedFlowInputコンポーネントのものと同じカラムがあることを確認します。
    5. 他のオプションはそのままにしておきます。
    このコンポーネントによって、TDI44990_1という名前のコレクションがレコードに挿入されます。
  4. tMongoDBInput_2をダブルクリックして[Basic settings] (基本設定)ビューを開き、次の操作を行います。
    1. [Use existing connection] (既存の接続を使用)を選択し、[Connection] (接続)ドロップダウンリストでtMongoDBConnection_1を選択します。
    2. [Collection] (コレクション)フィールドに、レコードの取得元であるコレクションの名前(このシナリオではTDI44990_1)を入力します。
    3. [Edit schema] (スキーマを編集)の横にある[...]をクリックしてスキーマエディターを開き、カラム名をdoc[DB Column] (DBカラム)*[Type] (タイプ)文字列にしてカラムを追加します。
    4. [Query] (クエリー)フィールドに"{name:/^name1/}"と入力します。
    5. 他のオプションはそのままにしておきます。
    このコンポーネントによって、nameフィールドがname1であるレコードがTDI44990_1コレクションから文字列として取得されます。
  5. tLogRow_4をダブルクリックして[Basic settings] (基本設定)ビューを開き、以下の操作を行います。
    1. [Sync column] (カラムを同期)ボタンをクリックし、このコンポーネントのスキーマにあるカラムがtMongoDBInput_2コンポーネントのものと同じであることを確認します。
    2. [Table (print values in cells of a table)] (テーブル(テーブルのセルの出力値))オプションを選択します。
    注: このシナリオでは、どのtLogRowコンポーネントでも同じ設定となります。
  6. tMongoDBOutput_2をダブルクリックして[Basic settings] (基本設定)ビューを開き、次の操作を行います。
    1. [Use existing connection] (既存の接続を使用)を選択し、[Component List] (コンポーネントリスト)ドロップダウンリストでtMongoDBConnection_1を選択します。
    2. [Collection] (コレクション)フィールドに、レコードの書き込み先となるコレクションの名前(このシナリオではTDI44990_2)を入力します。
    3. [Action on data] (データでのアクション)ドロップダウンリストで[Insert] (挿入)を選択します。
    4. [Sync columns] (カラムを同期)ボタンをクリックし、このコンポーネントのスキーマがtLogRow_4コンポーネントのものと同じカラムであることを確認します。
      [Mapping] (マッピング) テーブルにtLogRow_4コンポーネントのものと同じカラムがあることを確認します。
    5. 他のオプションはそのままにしておきます。
    このコンポーネントは、tMongoDBInput_2コンポーネントによって取得されたレコードをTDI44990_2というコレクションに挿入します。このコンポーネントのスキーマにはdocというカラムしかなく、カラムの[DB column] (DBカラム)*であり、タイプ文字列なので、このコンポーネントはダイナミックスキーマを使ってレコードを文字列としてコレクションに書き込みます。
  7. tMongoDBInput_3をダブルクリックして[Basic settings] (基本設定)ビューを開き、次の操作を行います。
    1. [Use existing connection] (既存の接続を使用)を選択し、[Component List] (コンポーネントリスト)ドロップダウンリストでtMongoDBConnection_1を選択します。
    2. [Collection] (コレクション)フィールドに、レコードの取得元であるコレクションの名前(このシナリオではTDI44990_1)を入力します。
    3. [Edit schema] (スキーマを編集)の横にある[...]をクリックしてスキーマエディターを開き、カラム名をdoc[DB Column] (DBカラム)*[Type] (タイプ)オブジェクトにしてカラムを追加します。
    4. [Query] (クエリー)フィールドに"{name:/^name2/}"と入力します。
    5. 他のオプションはそのままにしておきます。
    このコンポーネントによって、nameフィールドがname2であるレコードがTDI44990_1コレクションからオブジェクトとして取得されます。
  8. tMongoDBOutput_3をダブルクリックして[Basic settings] (基本設定)ビューを開き、次の操作を行います。
    1. [Use existing connection] (既存の接続を使用)を選択し、[Component List] (コンポーネントリスト)ドロップダウンリストでtMongoDBConnection_1を選択します。
    2. [Collection] (コレクション)フィールドに、レコードの書き込み先となるコレクションの名前(このシナリオではTDI44990_2)を入力します。
    3. [Action on data] (データでのアクション)ドロップダウンリストで[Insert] (挿入)を選択します。
    4. [Sync columns] (カラムを同期)ボタンをクリックし、このコンポーネントのスキーマがtLogRow_5コンポーネントのものと同じカラムであることを確認します。
      [Mapping] (マッピング) テーブルにtLogRow_5コンポーネントのものと同じカラムがあることを確認します。
    5. 他のオプションはそのままにしておきます。

    このコンポーネントは、tMongoDBInput_3コンポーネントによって取得されたレコードをTDI44990_2というコレクションに挿入します。このコンポーネントのスキーマにはdocというカラムしかなく、カラムの[DB column] (DBカラム)*であり、タイプオブジェクトなので、このコンポーネントはダイナミックスキーマを使ってレコードをオブジェクトとしてコレクションに書き込みます。

  9. tMongoDBInput_4をダブルクリックして[Basic settings] (基本設定)ビューを開き、次の操作を行います。
    1. [Use existing connection] (既存の接続を使用)を選択し、[Component List] (コンポーネントリスト)ドロップダウンリストでtMongoDBConnection_1を選択します。
    2. [Collection] (コレクション)フィールドに、レコードの取得元であるコレクションの名前(このシナリオではTDI44990_2)を入力します。
    3. [Edit schema] (スキーマを編集)の横にある[...]をクリックし、スキーマに_id (文字列型)、name (文字列型)、address (文字列型)、age (数値型)、birth (日付型および"yyyy-MM-dd"というパターン)というカラムを追加します。
    4. [Query] (クエリー)フィールドに"{}"と入力します。
      "{}"という文字列によって、コレクション内のレコードがすべてクエリーされます。
    5. 他のオプションはそのままにしておきます。
    このコンポーネントは、TDI44990_2というコレクションにある全レコードを検索して出力することで、tMongoDBOutput_2コンポーネントとtMongoDBOutput_3コンポーネントによって書き込まれたデータを検証します。