手順
- 最初のtFileInputInputコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
-
[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、ポップアップスキーマダイアログボックスで、倍数型の2つのカラムlatitudeとlongitudeを追加してスキーマを定義します。
- [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
-
[Define a storage configuration component] (ストレージ設定コンポーネントを定義)チェックボックスをオンにし、使うtHDFSConfigurationコンポーネントを選択します。
tFileInputDelimitedはこの設定を使い、トレーニングセットとして使われるサンプルデータにアクセスします。
- [Folder/File] (フォルダー/ファイル)フィールドで、トレーニングセットが保管されているディレクトリーを入力します。
- tReplicateコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
- [Cache replicated RDD] (複製されたRDDをキャッシュする)チェックボックスをオンにし、[Storage level] (ストレージレベル)ドロップダウンリストから[Memory only] (メモリのみ)を選択します。このようにして、このサンプルデータは複製され、テストセットとして使うためにメモリに保存されます。