Avro形式の従業員データのフィルタリング - 7.3

Avro

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > Avro
データガバナンス > サードパーティーシステム > ファイルコンポーネント > Avro
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > Avro
Last publication date
2024-02-22

このシナリオは、ビッグデータ関連Talend製品にのみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオでは、 Talend Map/Reduceジョブを作成し、Map/Reduceコンポーネントを使用して、Avro形式のデータの読み取り、変換、書き込みを行う方法を説明します。このジョブでは、Map/Reduceコードを生成し、Hadoop内で直接実行します。また、ワークスペース内の[Map] (マップ)バーには、このジョブではマッパーのみが使用されることが示され、ランタイムにはマップの計算の進捗状況が表示されます。

Talend Map/Reduceコンポーネントは、サブスクリプションのBig Dataユーザーのみが使用できます。また、このシナリオはMap/Reduceコンポーネントでのみ複製できます。

このシナリオで使用するサンプルデータは、理論的には以下のように読み取られるレコードの会社従業員情報ですが、実際にはAvro形式のファイルとしてのみ表示されます。
1;Lyndon;Fillmore;21-05-2008
2;Ronald;McKinley;15-08-2008
3;Ulysses;Roosevelt;05-10-2008
4;Harry;Harrison;23-11-2007
5;Lyndon;Garfield;19-07-2007
6;James;Quincy;15-07-2008
7;Chester;Jackson;26-02-2008
8;Dwight;McKinley;16-07-2008
9;Jimmy;Johnson;23-12-2007
10;Herbert;Fillmore;03-04-2008
				 

このシナリオに沿って作業をする前に、使用するHadoopディストリビューションへの適切なアクセス権限と許可があることをご確認ください。その後、次の手順に従ってください。