データをMongoDBにアップサート - 7.3

MongoDB

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MongoDB

手順

  1. tMongoDBConnectionをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
  2. [DB Version] (バージョン)リストから、使用しているMongoDBバージョンを選択します。
  3. [Server] (サーバー)および[Port] (ポート)フィールドに、接続の詳細を入力し ます。
    [Database] (データベース)フィールドに、MongoDBデータベースの名前を入力します。
  4. tFixedFlowInputをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
    [Mode] (モード)エリアで[Use Inline Content (delimited file)] (インラインコンテンツの使用)を選択します。
    [Content] (コンテンツ)フィールドに、MongoDBデータベースをアップサーティングするためのデーターを入力します。たとえば、以下のようにします:
    1;Andy;Open Source Outlook;Open Source,Talend;Talend, the leader of the open source world...
    2;Andy;Data Integration Overview;Data Integration,Talend;Talend, the leading player in the DI field...
    3;Anderson;ELT Overview;ELT,Talend;Talend, the big name in the ELT circle...
    4;Andy;Big Data Bang;Big Data,Talend;Talend, the driving force for Big Data applications... 
    上に示したように、3番目のレコードの作成者は変更され、4番目のレコードは新しくなっています。
  5. tMongoDBOutputコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
    [Use existing connection] (既存の接続を使用)[Die on error] (エラー発生時に強制終了)チェックボックスをオンにします。
    [Collection] (コレクション)フィールドに、コレクションの名前blogを入力します。
    [Action on data] (データのアクション)リストから[Upsert] (アップサート)を選択します
  6. [Edit schema] (スキーマを編集)の横の[...]ボタンをクリックし、スキーマエディターを開きます。
  7. [+]ボタンをクリックすると右の部分に、[id][author] (作成者)[title] (タイトル)[keywords] (キーワード)[contents] (コンテンツ)の5つのカラムが、それぞれ[Integer] (整数)および[String] (文字列)のタイプで入力されます。
    をクリックして、すべてのカラムを入力テーブルにコピーします。
    [OK]をクリックしてエディターを閉じます。
  8. [Advanced Settings] (詳細設定)ビューで、[Generate JSON Document](JSON ドキュメントの生成)チェックボックスをオンにします。
    [Remove root node] (ルートノードの削除)チェックボックスをオンにします。
    [Data node] (データノード)[Query node] (クエリーノード)フィールドに、[data][query]と入力します。
  9. [Configure JSON Tree] (JSONツリーの構成)の横にある[...]ボタンをクリックして、構成インターフェイスを開きます。
  10. ノードrootTagを右クリックし、コンテキストメニューから[Add Sub-element] (サブ要素の追加)を選択します。
    表示されるダイアログボックスで、[Data node] (デ ータノード)[data] (データ)を入力します:
    [OK]をクリックしてウィンドウを閉じます。
    この操作を繰り返して、[query] (クエリー)[Query node] (クエリーノード)として定義します。
    ノード[data] (データ)を右クリックし、コンテキスト メニューから [Set As Loop Element] (ループ要素として設定)を選択します。
    警告:

    これらのノードは、更新とアップサートのアクションに必須です。これらはデータベースには保管されませんが、更新とアップサートのアクションを有効にすることを目的としています。

  11. [Schema list] (スキーマリスト)の下にあるすべてのカラムを選択し、[data] (データ)ノードにドロップします。
    表示されるウィンドウで、[Create as sub-element of target node] (ターゲットノードのサブ要素として作成)を選択します。
    [OK]をクリックしてウィンドウを閉じます。
    この操作を繰り返して、[Query] (クエリー)ノードの下の[Schema list] (スキーマリスト)からidカラムを削除します。
  12. [data] (データ)の下のノードidを右クリックし、コンテキストメニューから[Add Attribute] (属性の追加)を選択します。
    表示されるダイアログボックスで、属性名としてtypeを入力します:
    [OK]をクリックしてウィンドウを閉じます。
    idの下のノード@typeを右クリックし、コンテキストメニューから[Set A Fix Value] (修正値の設定)を選択します。
    表示されるダイアログボックスで、属性値として[integer] (整数)を入力し、id値がデータベースに整数として保存されていることを確認します。
    [OK]をクリックしてウィンドウを閉じます。
    この操作を繰り返して、 [Query] (クエリー)の下の idノードにこの属性を設定します。
    [OK]をクリックして、[JSON Tree configuration] (JSONツリー構成)インターフェースを閉じます。
  13. tMongoDBInputをダブルクリックして 、[Basic settings] (基本設定)ビューを開きます。
    [Use existing connection] (既存の接続の使用)チェックボックスをオンにします。
    [Collection] (コレクション)フィールドに、コレクションの名前blogを入力します。
    [Edit schema] (スキーマを編集)の横の[...]ボタンをクリックし、スキーマエディターを開きます。
    [+]ボタンをクリックすると、idauthortitlekeywordscontentsの5列のカラムが、それぞれ[IntegerおよびStringのタイプで入力されます。
    [OK]をクリックして、エディターを閉じます。
    カラムは[Mapping] (マッピング)エリアの左側に表示されるようになります。
    [author] (作成者)[title] (タイトル)[keywords] (キーワード)[contents] (コンテンツ)の4列のカラムについて、適切な位置からデータを取得できるように、親ノードの[post] (投稿)を入力します。
  14. tLogRowをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。
    [Mode] (モード)エリアで、[Table (print values in cells of a table] (テーブル: テーブルのセルに値を印刷)を選択すると表示が見やすくなります。