条件に基づいてデータの行をフィルタリングしてローカルファイルに結果を保存 - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

このシナリオは、ビッグデータ関連Talend製品にのみ適用されます。

Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオでは、特定の国からの顧客を見つけるために顧客のリストをフィルタリングして、結果リストをローカルファイルに保管する4コンポーネントジョブについて説明します。入力データがフィルタリングされる前に、リストから複製エントリが最初に削除されます。

入力ファイルには NameCountryAgeという3つのカラムが含まれ、以下に示されるように、一部の重複エントリがあります。

Mario;PuertoRico;49
Mike;USA;22
Ricky;PuertoRico;37
Silvia;Spain;20
Billy;Canada;21
Ricky;PuertoRico;37
Romeo;UK;19
Natasha;Russia;25
Juan;Cuba;23
Bob;Jamaica;55
Mario;PuertoRico;49