メイン コンテンツをスキップする 補完的コンテンツへスキップ

サンプルデータを読み取ってキャッシュ

手順

  1. 最初のtFileInputInputコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、ポップアップスキーマダイアログボックスで、倍数型の2つのカラムlatitudelongitudeを追加してスキーマを定義します。
  3. [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
  4. [Define a storage configuration component] (ストレージ設定コンポーネントを定義)チェックボックスをオンにし、使うtHDFSConfigurationコンポーネントを選択します。
    tFileInputDelimitedはこの設定を使い、トレーニングセットとして使われるサンプルデータにアクセスします。
  5. [Folder/File] (フォルダー/ファイル)フィールドで、トレーニングセットが保管されているディレクトリーを入力します。
  6. tReplicateコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  7. [Cache replicated RDD] (複製されたRDDをキャッシュする)チェックボックスをオンにし、[Storage level] (ストレージレベル)ドロップダウンリストから[Memory only] (メモリのみ)を選択します。このようにして、このサンプルデータは複製され、テストセットとして使うためにメモリに保存されます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。