フローを複製し、2つの同一のフローをそれぞれソート - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

このシナリオは、ビッグデータ関連Talend製品にのみ適用されます。

Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオのジョブは、Pigコンポーネントを使用して、特定のHDFSシステムからロードされた名前と州を処理します。入力フローを読み取り、複製した後に、名前および州にそれぞれ基づいて2つの同一のフローをソートして、結果をHDFS内に書き戻します。

このジョブを複製する前に、使用されるHadoopディストリビューションでデータを読み込んだり、書き込んだりする適切な権限を持っていることとPigがそのディストリビューションに正しくインストールされたことをご確認ください。