このページ上

メインコンテンツをスキップする

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。

Kuduジョブのデータフローを設計する

Studio TalendのIntegrationパースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のSpark Batchジョブを1つ作成します。
Spark Batchジョブの作成方法は、Sparkジョブを作成をご覧ください。
ワークスペース内に使用するコンポーネントの名前を入力し、表示されるリストからこのコンポーネントを選択します。このシナリオでは、コンポーネントは、tHDFSConfiguration、tKuduConfiguration、tFixedFlowInput、tKuduOutput、tKuduInput、およびtLogRowになります。
tFixedFlowInputコンポーネントは、サンプルデータをデータフローにロードするために使われます。現実のケースではtFixedFlowInputの代わりにtFileInputDelimitedやtMapといった他のコンポーネントを使用して転送するデータを準備する、より洗練されたプロセスを設計できます。
[Row] (行) > [Main] (メイン)リンクを使って、tFixedFlowInputをtKuduOutputに接続します。
[Row] (行) > [Main] (メイン)リンクを使ってtMongoDBInputをtLogRowに接続します。
[Trigger] (トリガー) > OnSubjobOkリンクを使ってtFixedFlowInputをtMongoDBInputに接続します。
tHDFSConfigurationとtKuduConfigurationは接続しないでおきます。