手順
-
Studioの Integration パースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のSpark Batchジョブを1つ作成します。
Spark Batchジョブの作成方法は、Talend Open Studio for Big Data入門ガイドをご覧ください。
-
ワークスペース内に使用するコンポーネントの名前を入力し、表示されるリストからこのコンポーネントを選択します。このシナリオでは、コンポーネントはtHDFSConfiguration、tMongoDBConfiguration、tFixedFlowInput、tMongoDBOutput、tMongoDBInputおよびtLogRowになります。
tFixedFlowInputコンポーネントは、サンプルデータをデータフローにロードするために使用されます。現実のケースではtFixedFlowInputの代わりにtFileInputDelimitedやtMapといった他のコンポーネントを使用して転送するデータを準備する、より洗練されたプロセスを設計できます。
- [Row] (行) > [Main] (メイン)リンクを使用してtFixedFlowInputをtMongoDBOutputに接続します。
- [Row] (行) > [Main] (メイン)リンクを使用してtMongoDBInputをtLogRowに接続します。
- [Trigger] (トリガー) > [OnSubjobOk]リンクを使用してtFixedFlowInputをtMongoDBInputに接続します。
- tHDFSConfigurationおよびtMongoDBConfigurationは接続しないでおきます。