メイン コンテンツをスキップする 補完的コンテンツへスキップ

データフローを配列する

手順

  1. Studio TalendIntegrationパースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブ設計)ノードから、たとえばrf_model_creationという名前の空のSpark Batchジョブを作成します。
    Spark Batchジョブの作成方法は、Sparkジョブを作成をご覧ください。
  2. ワークスペース内に使用するコンポーネントの名前を入力し、表示されるリストからこのコンポーネントを選択します。このシナリオでは、コンポーネントは、tHDFSConfigurationtFileInputDelimitedtRandomForestModelコンポーネント、4つのtModelEncoderコンポーネントです。
    4つのtModelEncoderコンポーネントに異なる名前を付けることをお勧めします。そうすれば、各コンポーネントを使っ行うタスクを簡単に識別できます。このシナリオではそれぞれ、Tokenizetftf_idf features_assemblerとラベル付けされています。
  3. 前に画像で示したように、tHDFSConfiguration以外のコンポーネントを[Row] (行) > [Main] (メイン)リンクを使って接続します。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。