手順
-
Studioの Integration パースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のSpark Streamingジョブを1つ作成します。
Spark Streamingジョブの作成方法の詳細は、 Talend Open Studio for Big Data入門ガイド をご参照ください。
- ワークスペース内に使用するコンポーネントの名前を入力し、表示されるリストからこのコンポーネントを選択します。このシナリオでのコンポーネントは、tHDFSConfiguration、tKafkaInput、tWindow、tExtractJSONFields、tMap、tAggregateRow、tTop、tLogRowです。
- [Row] (行) > [Main] (メイン)リンクを使って、tKafkaInput、tWindow、tExtractJSONFields、tMapを接続します。
- [Row] (行) > [Main] (メイン)リンクを使ってtMapをtAggregateRowに接続し、表示されるダイアログボックスでこの接続に名前を付けます。たとえば、hashtagという名前を付けます。
- [Row] (行) > [Main] (メイン)リンクを使って、tAggregateRow、tTop、tLogRowを接続します。
- tHDFSConfigurationコンポーネントは接続しないでおきます。