このページ上

メインコンテンツをスキップする

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。

デシジョンツリーモデルをトレーニング

このセクションでは、デシジョンツリーモデルのトレーニングを行う方法について説明します。

手順

ワークスペースにtDecisionTreeModelコンポーネントを追加します。
[Main] (メイン)行を使って、tModelEncoderをtDecisionTreeModelに接続します。
tDecisionTreeModelをダブルクリックして[Basic settings] (基本設定)を開きます。
[Storage] (ストレージ)で[Define a storage configuration component] (ストレージ設定コンポーネントを定義)チェックボックスをオンにし、HDFSストレージを選択します。
前に作成したスキーマを選択します。
[Features Column] (機能カラム)で、MyFeaturesを選択します。
[Label Column] (ラベルカラム)で、MyLabelsを選択します。
[Model location] (モデルのロケーション)で[Save the model on file system (only for Spark 1.4 or higher)] (モデルをファイルシステムに保存(Spark 1.4以降のみ))チェックボックスを選択し、HDFSファイルシステムにパスを入力します。
この例では、/user/puccini/machinelearning/decisiontrees/marketing/decisiontree.modelです。
残りの設定をデフォルト値のままにしておきます。

ジョブ設定は次のようになります。
[Run] (実行)を選択して、[Spark configuration] (Spark設定)に移動します。
[Use local mode] (ローカルモードを使用)チェックボックスを選択します。

このジョブはHadoopクラスターで直接実行することもできます。これは本番環境で最も可能性が高いシナリオです。そのためには、[Use local mode] (ローカルモードを使用)チェックボックスを消去するなど、ジョブの実行方法を若干調整する必要があります。

このページは役に立ちましたか?

こちらにフィードバックをお寄せください

デシジョンツリーモデルをトレーニング

手順

このセクション内

このページは役に立ちましたか?