このセクションでは、Hadoopクラスターを作成して、機械学習ルーチンを開発する方法について説明します。
手順
-
[Metadata] (メタデータ)を展開します。
-
[Hadoop Cluster] (Hadoopクラスター)を右クリックし、新しいクラスターを作成します。
-
クラスター上でLinux OSユーザーを指定します。
ここでは、pucciniが既に作成されまています。
この記事で使われるトレーニングデータとテストデータは、元のソースから多少変更されて、HDFS内に事前ロードされました。これらのデータセットは、以下からダウンロードできます。
-
HDFS接続を以下のように設定します。