Map/Reduce Jobを使用して平均以上の給与記録を選択する
このシナリオは、ビッグデータ関連Talend製品にのみ適用されます。
Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。
このシナリオでは、6つのコンポーネントのジョブが作成され、一連のサンプルデータの平均給与を計算し、平均以上の給与を選択します。
使用されるサンプルデータは、HDFSシステムに既に保存されており、以下のように使用され、読み取られます。
1 Lyndon 1200
2 Ronald 3500
3 Ulysses 5000
4 Harry 2000
5 Garfield 1800
6 James 3300
7 Chester 4200
8 Dwight 2200
9 Jimmy 2800
10 Herbert 3500
フィールド間のセパレータは/tであり、サンプルデータの3つのカラムはID、[name] (名前)、[salary] (給与)であることがわかります。
tHDFSOutputコンポーネントを使用して、使用するHDFSシステムにサンプルデータを書き込むことができます。詳細は、tHDFSOutputをご覧ください。