最新のHadoopディストリビューションをダイナミックに追加する(テクニカルプレビュー) - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

Studioで使用するHadoopディストリビューションにサポートがない場合は、以下に説明する手順に従ってこのディストリビューションを追加し、Studioで使用できるようにします。

この方法によるダイナミックディストリビューションの追加はTalendで正式にサポートされているわけではありません。

現在のStudioバージョンにおいて、この手続きを利用して追加できるのは Clouderaディストリビューションに限られます。

始める前に

前提条件:
  • サブスクリプションベースの ビッグデータ関連Talendソリューションの1つであること。

  • Studioのバージョンが7.0以降であること。

手順

  1. Integrationパースペクティブで、[File] (ファイル) > [Edit project properties] (プロジェクトプロパティの編集)をクリックして[Project settings] (プロジェクト設定)ダイアログボックスを開きます。
  2. [General] (全般)ノードを展開し、[Dynamic distribution settings] (ダイナミックディストリビューションの設定)をクリックしてビューを開きます。
  3. [Distribution] (ディストリビューション)ドロップダウンリストから[Cloudera]を選択します。
  4. [Override default setup] (デフォルト設定の上書き)チェックボックスを選択して[Repository] (リポジトリー)フィールドをアクティブ化にします。
  5. [Repository] (リポジトリー)フィールドでは Talendによって提供されるプロキシとなるデフォルトアドレスをそのまま残します。
  6. [Dynamic distribution setup] (ダイナミックディストリビューションの設定)ボタンをクリックしてダイナミックディストリビューション設定ウィザードを開きます。
  7. [Create new dynamic configuration] (ダイナミック設定の新規作成)ラジオボタンを選択し、[Refresh] (最新の情報に更新)をクリックしして接続先Clouderaリポジトリーで利用可能なClouderaバージョンを[Version] (バージョン)ドロップダウンリストに表示します。
  8. Studioで使用する設定を生成する対象のClouderaバージョンを選択します。
  9. [Finish] (終了)をクリックします。

    Studioはこのディストリビューションの設定ファイルをClouderaリポジトリから取得し始めます。この取得にはしばらく時間がかかることがあります。

    完了したら[Dynamic distribution setup] (ダイナミックディストリビューションのセットアップ)ウィザードは自動的に閉じ、[Dynamic distribution settings] (ダイナミックディストリビューションの設定)ビューに戻ります。以前選択されたバージョンに対して新たに生成されたこの「ダイナミック」 ディストリビューションは、[Version] (バージョン)リストに表示されます。

  10. 必要に応じてこの操作を繰り返し、別のバージョンをさらに追加することもできます。または、[OK] をクリックして[Project settings] (プロジェクト設定)ダイアログボックスを閉じます。

タスクの結果

この新しい バージョンは、Studioと共に提供されている組み込みHadoopディストリビューションと同様に使用できます。以下のような処理が可能です。
  • このダイナミック ディストリビューションの接続を[Repository] (リポジトリ)で設定し、Talendジョブでこの接続を再利用します。

  • このダイナミックディストリビューションをジョブで直接使用します。 ジョブをビルドしてZIP内に実行可能ファイルを生成し、実行可能ファイルをWindowsで実行する必要がある場合は、.batスクリプトを使用せず、.ps1スクリプトを使用します。

ジョブをエクスポートする場合は通常、[Repository] (リポジトリ)で定義した接続などの依存性と共にエクスポートできますが、ダイナミックディストリビューションへの接続は同様にエクスポートすることができません。エクスポートが必要な場合はダイナミックHadoopディストリビューションの設定をエクスポートまたはインポートする(テクニカルプレビュー)を参照して下さい。