このセクションでは、デシジョンツリーモデルのトレーニングを行う方法について説明します。
手順
- パレットに[tDecisionTreeModel]コンポーネントを追加します。
- [Main] (メイン)を使って、[tModelEncouder]を[tDecisionTreeModel]に接続します。
- [tDecisionTreeModel]をダブルクリックして、[Component] (コンポーネント)ビューを選択します。
- [Storage] (ストレージ)の下にあるチェックボックスを選択して、HDFSストレージを選択します。
- 前に作成したスキーマを選択します。
- [Features Column] (機能カラム)で、MyFeaturesを選択します。
- [Label Column] (ラベルカラム)で、MyLabelsを選択します。
- [Model location] (モデルロケーション)の下にあるチェックボックスを選択して、HDFSファイルシステムを/user/puccini/machinelearning/decisiontrees/marketing/decisiontree.modelに保存します。
-
残りの設定をデフォルト値のままにしておきます。
最終ジョブは次のように表示されるはずです。
- [Run] (実行)を選択して、[Spark configuration] (Spark設定)に移動します。
-
[Use local mode] (ローカルモードを使用)チェックボックスを選択します。
このジョブはHadoopクラスターで直接実行することもできます。これは本番環境で最も可能性が高いシナリオです。そのためには、[Use local mode] (ローカルモードを使用)チェックボックスを消去するなど、ジョブの実行方法を若干調整する必要があります。