メイン コンテンツをスキップする 補完的コンテンツへスキップ

ランダムフォレストを使ってモデルをトレーニングする

手順

  1. tRandomForestModelをダブルクリックして[Component] (コンポーネント)ビューを開きます。
  2. [Label column] (ラベルカラム)リストから、分類に使われるクラスを提供するカラムを選択します。このシナリオではlabelです。このカラムには2つのクラス名が含まれています。ジャンクメッセージ用のspamと、通常のメッセージ用のhamです。
  3. [Features column] (特徴カラム)リストから、分析する特徴ベクトルを提供するカラムを選択します。このシナリオではfeatures_vectを選択します。これはすべての特徴を組み合わせます。
  4. [Save the model on file system] (モデルをファイルシステムに保存)チェックボックスをオンにし、表示された[HDFS folder] (HDFSフォルダー)フィールドに、生成されたモデルの保管に使うディレクトリーを入力します。
  5. [Number of trees in the forest] (フォレスト内のツリーの数)フィールドに、tRandomForestModelで構築するデシジョンツリーの数を入力します。現在のジョブを実行して分類モデルを作成するには、さまざまな数を数回試す必要があります。各実行で作成されたすべてのモデルの評価結果を比較した後、使う必要がある数を判断できます。このシナリオでは20入力します。
    評価ジョブは、次のいずれかのセクションに表示されます。
  6. 他のパラメーターはそのままにしておきます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。