ジョブの変換 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

標準からMapReduceへ、またはMapReduceからSparkへといったように、ジョブを別のフレームワークからの変換によって作成することができます。 ソースジョブで使用しているコンポーネントをターゲットジョブにも使用できる場合は、そうすることをお勧めします。

たとえば、標準ジョブをMapReduceジョブに変換する必要がある場合は、以下の手順に従います。

手順

  1. 変換する標準ジョブを右クリックし、コンテキストメニューから[Edit properties] (プロパティの編集)を選択します。
    [Edit properties] (プロパティの編集)ウィンドウが表示されます。
  2. ジョブの説明を変更する必要がある場合は、該当するフィールドを変更します。
    変更不可能なフィールドの情報を編集する必要がある場合は、[Project settings] (プロジェクト設定)ウィザードを使って変更を行う必要があります。詳細は、プロジェクト設定のカスタマイズを参照して下さい。
  3. [Job Type] (ジョブタイプ)リストから[Big Data Batch] (ビッグデータバッチ)を選択し、[Framework] (フレームワーク)リストから[MapReduce]を選択します。 [Finish] (終了) をクリックして、このウィンドウを閉じます。
    変換済みのジョブが[Big Data Batch] (ビッグデータバッチ)ノードの下に表示されます。
    コンテキストメニューから[Duplicate] (重複)オプションを選択して変換にアクセスすることも可能です。このアプローチを使うと、ソースジョブを元のフレームワークと共に保持する一方で、重複ジョブをターゲットフレームワークに作成することができます。

タスクの結果

MapReduceジョブからこの手順を繰り返し、標準ジョブまたは別のフレームワークに変換することもできます。 その場合は、コンテキストメニューから[Edit Big Data Batch properties] (ビッグデータバッチプロパティの編集)を選択します。

標準ジョブで、リポジトリで定義したHadoopへの接続を使用している場合は、[Finish] (終了)ボタンをクリックすると[Select node] (ノードの選択)ウィザードが表示され、その接続を選択してMapReduceジョブで自動的にその接続を再利用することができます。

このウィザードに表示されるコンポーネントは、ソースの標準ジョブで使用されているものです。それを選択すると、作成しているMapReduceジョブでもHadoopの接続メタデータが再利用されます。