イベントデータをロード - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

手順

  1. eventというラベルの付いたtPigLoadをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
  2. [Edit schema] (スキーマを編集)の横のボタンをクリックし、スキーマエディターを開きます。
  3. ボタンを3回クリックして3つの行を追加し、[Column] (カラム)カラムで、名前をそれぞれdatastreeteventに変更します。
  4. [OK]をクリックして、これらの変更を保存します。
  5. [Mode] (モード)エリアで[Map/Reduce]を選択します。
    特定のHadoopディストリビューションへの接続を1番目のtPigLoadコンポーネント(traffic)で設定したため、このeventコンポーネントはその接続を再使用し、[Distribution] (ディストリビューション)リストと[Version] (バージョン)リストの対応するオプションが自動的に選択されました。
  6. [Load function] (関数のロード)フィールドで、[PigStorage]関数を選択して、ソースデータを読み込みます。
  7. [Input file URI] (入力ファイルのURI)フィールドに、イベントデータが保存されているディレクトリーを入力します。先に説明したように、この例のディレクトリーは"/user/ychen/tpigmap/date&event"です。