tPigStoreResultを設定 - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

このタスクについて

2つのtPigStoreResultコンポーネントを使用して、ソートされた各データをHDFS内に書き込みます。

手順

  1. 1番目のtPigSortResultコンポーネントをダブルクリックし、その[Component] (コンポーネント)ビューを開いて、名前ごとにソートされたデータを書き込みます。
  2. [Result file] (結果ファイル)フィールドに、データが書き込まれるディレクトリーを入力します。このディレクトリーが存在しない場合は、作成されます。このシナリオでは、/user/ychen/sort/tPigreplicate/byName.csvと入力します。
  3. [Remove result directory if exists] (結果ディレクトリーがある場合は削除する)をオンにします。
  4. [Store function] (関数の保存)リストで、[PigStorage]を選択します。
  5. [Field separator] (フィールド区切り)フィールドにセミコロン(;)を入力します。
  6. 他のtPigStoreResultで同じことを行いますが、州ごとにソートされているデータ用に別のディレクトリーを設定します。このシナリオでは、/user/ychen/sort/tPigreplicate/byState.csvです。