MapReduceジョブの作成 - 7.1

Talend Big Data入門ガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
task
インストールとアップグレード
ジョブデザインと開発
EnrichPlatform
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
Talend MapReduceジョブでは、Talend MapReduceコンポーネントにアクセスして使用し、データの読み取り、変換、または書き込みを行うMapReduceプログラムを視覚的に設計することができます。

始める前に

  • Talend Studioを起動し、Integrationパースペクティブを開いていること。

手順

  1. [Repository] (リポジトリ)ツリービューで[Job Designs] (ジョブデザイン)ノードを展開し、[Big Data Batch] (ビッグデータバッチ)ノードを右クリックして、コンテキストメニューから[Create folder] (フォルダーの作成)を選択します。
  2. [New Folder] (新規フォルダー)ウィザードでジョブフォルダーにgetting_startedという名前を付け、[Finish] (終了)をクリックしてフォルダーを作成します。
  3. getting_startedフォルダーを右クリックし、[Create folder] (フォルダーの作成)をもう一度選択します。
  4. [New Folder] (新規フォルダー)ウィザードで新しいフォルダーにmapreduceという名前を付け、[Finish] (終了)をクリックしてフォルダーを作成します。
  5. mapreduceフォルダーを右クリックし、[Create Big Data Batch Job] (ビッグデータバッチジョブの作成)を選択します。
  6. [New Big Data Batch Job] (新しいビッグデータバッチジョブ)ウィザードで、[Framework] (フレームワーク)ドロップダウンリストから[MapReduce]を選択します。
  7. このMapReduceジョブに名前およびその他の有用な情報を入力します。

    たとえば、[Name] (名前)フィールドにaggregate_movie_director_mrと入力します。

タスクの結果

StudioでMapReduceコンポーネント[Palette] (パレット)が使用できるようになりました。この[Palette] (パレット)、および[Repository] (リポジトリ)内の[Metadata] (メタデータ)ノードを活用して、ジョブの設計を開始することができます。