手順
-
2番目のtPigLoadコンポーネントをダブルクリックし、その[Component] (コンポーネント)ビューを開きます。
- [Edit schema] (スキーマを編集)の横の[...]ボタンをクリックし、スキーマエディターを開きます。
-
[+]ボタンを2回クリックして2つの行を追加し、[Column] (カラム)カラムで名前をそれぞれstudentとfriendに変更します。
- [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
-
[Mode] (モード)エリアで[Map/Reduce]を選択します。
このコンポーネントは、メインtPigLoadコンポーネントで設定したHadoop接続を再使用します。そのため、[Distribution] (ディストリビューション)フィールドと[Version] (バージョン)フィールドに、このメイン読み取りコンポーネントの値が自動的に入力されました。
- [Load function] (関数のロード)フィールドで、[PigStorage]関数を選択して、ソースデータを読み込みます。
- [Input file URI] (入力ファイルのURI)フィールドに、ソースデータが保存されているディレクトリーを入力します。先に説明したように、このデータは学生と友人のサンプルデータを含む2番目の関係からです。