tPigLoadを設定 - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

手順

  1. tPigLoadをダブルクリックして、[Component] (コンポーネント)ビューを開きます。
  2. [Edit schema] (スキーマを編集)の横のボタンをクリックし、スキーマエディターを開きます。
  3. ボタンを2回クリックして行を2つ追加し、それらにそれぞれNameStateという名前を付けます。
  4. [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
  5. [Mode] (モード)エリアでは、このシナリオで使用されるHadoopがリモートマシンにインストール済みであるため、[Map/Reduce]を選択します。選択すると、未設定の対応するパラメーターが表示されます。
  6. [Distribution] (ディストリビューション)リストと[Version] (バージョン)リストで、使用するHadoopディストリビューション選択します。
  7. [Load function] (関数のロード)リストで、[PigStorage]を選択します。
  8. [NameNode URI]フィールドと[Resource Manager] (リソースマネージャー)フィールドに、[Map/Reduce]のために使用される[NameNode][ResourceManager]のロケーションをそれぞれ入力します。 WebHDFSを使用している場合、ロケーションはwebhdfs://masternode:portnumberとなります。WebHDFS with SSLはまだサポートされていません。
  9. [Input file URI] (入力ファイルURI)フィールドに、HDFSから読み取るデータの場所を入力します。この例では、ロケーションは/user/ychen/raw/NameState.csvです。
  10. [Field separator] (フィールド区切り)フィールドでセミコロン(;)を入力します。