コンポーネントをリンク - 7.3

MongoDB

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > MongoDB
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > MongoDB

手順

  1. Studioの Integration パースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のSpark Batchジョブを1つ作成します。
    Spark Streamingジョブの作成方法の詳細は、 Talend Open Studio for Big Data入門ガイド を参照してください。
  2. ワークスペース内に使用するコンポーネントの名前を入力し、表示されるリストからこのコンポーネントを選択します。このシナリオでは、コンポーネントはtHDFSConfigurationtMongoDBConfigurationtFixedFlowInputtMongoDBOutputtMongoDBLookupInputtMapおよびtLogRowになります。
    tFixedFlowInputコンポーネントは、ムービーに関するデータをデータフローにロードするために使用されます。現実のケースではtFileInputDelimitedなどの他のコンポーネントを代わりに使用して転送するデータを準備する、より洗練されたプロセスを設計できます。
  3. tFixedFlowInput[Row > Main] (行>メイン)リンクを使って、tMapに接続します。
    このようにして、tMapへのメインフローが作成されます。映画情報はこのフローを介して送信されます。
  4. tMongoDBLookupInput[Row > Main] (行>メイン)リンクを使って、tMapに接続します。
    このようにして、tMapへのルックアップフローが作成されます。映画監督の情報は、このフローを介して送信されます。
  5. tMongoDBOutput[Row > Main] (行>メイン)リンクを使って、tMapに接続します。たとえば、out1という名前を付けます。
  6. 同じことを行って tMaptLogRowに接続し、この接続に名前を付けて[reject] (拒否)します。
  7. tHDFSConfigurationおよびtMongoDBConfigurationは接続しないでおきます。