手順
-
tPredictをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
- [Define a storage configuration component] (ストレージ設定コンポーネントを定義)チェックボックスをオンにし、使うtHDFSConfigurationコンポーネントを選択します。
- [Model type] (モデルタイプ)ドロップダウンリストから[Kmeans model] (K-meansモデル)を選択します。
-
[Model on filesystem] (ファイルシステムのモデル)ラジオボタンを選択し、K-Meansモデルが保存されているディレクトリーを入力します。
この場合、tPredictコンポーネントには、モデルがクラスターのラベルを提供するlabelと呼ばれる読み取り専用のカラムが含まれています。
-
tFileOutputDelimitedをダブルクリックして[Component] (コンポーネント)ビューを開きます。
- [Define a storage configuration component] (ストレージ設定コンポーネントを定義)チェックボックスをオンにし、使うtHDFSConfigurationコンポーネントを選択します。
- [Folder] (フォルダー)フィールドで、予測結果を保管するHDFS内の場所を参照します。
- [Action] (アクション)ドロップダウンリストから[Overwrite] (上書き)を選択します。ただし、ターゲットフォルダーが存在しない場合は、[Create] (作成)を選択します 。
- [Merge result to single file] (結果を単一ファイルにマージ)チェックボックスをオンにしてから 、[Remove source dir] (ソースディレクトリーを削除)チェックボックスをオンにします。
- [ Merge file path] (ファイルパスをマージ)フィールドで、マージされた予測結果を保管するHDFS内の場所を参照します。