機械学習用のHadoopクラスターを作成 - Cloud - 8.0

Machine Learning

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 機械学習コンポーネント
データガバナンス > サードパーティーシステム > 機械学習コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 機械学習コンポーネント
このセクションでは、Hadoopクラスターを作成して、機械学習ルーチンを開発する方法について説明します。

手順

  1. [Metadata] (メタデータ)を展開します。
  2. [Hadoop Cluster] (Hadoopクラスター)を右クリックし、新しいクラスターを作成します。
  3. クラスター上でLinux OSユーザーを指定します。

    ここでは、pucciniが既に作成されまています。

    この記事で使われるトレーニングデータとテストデータは、元のソースから多少変更されて、HDFS内に事前ロードされました。これらのデータセットは、以下からダウンロードできます。

  4. HDFS接続を以下のように設定します。