最新のビッグデータプラットフォームをダイナミックに追加(ダイナミックディストリビューション) - 7.3

Talend Big Data Platform Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発

Talend Studioで使用したいビッグデータプラットフォームにサポートがない場合は、以下に説明する手順に従ってこのディストリビューションを追加し、Studioで使用できるようにします。

最新バージョンのStudioでは、この手順を使ってClouderaとHortonworksのディストリビューションのみ追加できます。この手順では、Clouderaデータプラットフォームを使用してダイナミックディストリビューションをStudioに追加する方法を説明します。

このダイナミックサポート機能により、Talend Studioのリリース時にはまだリリースされていなかったClouderaやHortonworksのバージョンをより迅速かつ柔軟に使用できるようになります。このバージョンを追加するだけで準備は完了です。

この方法で追加されたダイナミックディストリビューションは一般的に、ユーザーのディストリビューションのTalend認証メジャーリリースのマイナーバージョンです。Talendはディストリビューションベンダーの互換性ステートメントに依拠して、Studioとこれらのマイナーバージョンとの互換性を確認します。また、この方法でこれらのマイナーバージョンとTalend認証バージョン 認定済みのディストリビューションバージョン、およびTalend認定済みバージョンと互換バージョンに関する Talendの一般的なサポートポリシーは、『 Talendインストールガイド』を参照してください。
  • ディストリビューションのバージョンリストに、[Builtin] (組み込み)というラベルの付いたバージョンがいくつかあります。Studioのリリース時に、これらのバージョンがダイナミックディストリビューションメカニズムを使用してTalendによって追加され、Studioと共に提供されました。これらはTalendによって認定されており、したがって、公式にサポートされており、すぐに使用できます。

始める前に

前提条件:
  • ビッグデータ関連のいずれかのTalendソリューションがあること。

手順

  1. Integrationパースペクティブで、[File] (ファイル) > [Edit Project properties] (プロジェクトプロパティの編集)をクリックして[Project Settings] (プロジェクト設定)ダイアログボックスを開きます。
  2. [General] (一般) > [Dynamic distribution settings] (ダイナミックディストリビューションの設定)をクリックしてビューを開きます。
  3. [Distribution] (ディストリビューション)ドロップダウンリストから[Cloudera Data Platform] (Clouderaデータプラットフォーム)を選択します。
  4. ダウンロードするダイナミックディストリビューションjarファイルを保存するローカルNexusリポジトリーを設定します。
    必須ではありませんが、このステップにより、他のユーザーまたは他のStudioインスタンスが同じjarファイルをダウンロードする時間が大幅に短縮されます。
    1. ローカルNexusリポジトリー上にプロキシを設定し、このプロキシを専用のTalendプロキシであるhttps://talend-update.talend.com/nexus/content/groups/dynamicdistribution/にリンクします。
      このTalendプロキシへの接続に使用する認証情報は次のとおりです。
      • ユーザー名: studio-dl-client
      • パスワード: studio-dl-client

      ローカルプロキシを作成する時に、このローカルプロキシに固有の認証情報を定義する必要があります。Nexusプロキシの作成方法は、Nexusの公式ドキュメンテーションでProxy settingsを参照してください。

    2. [General] (一般) > [Artifact Proxy Setting] (アーティファクトプロキシ設定)をクリックしてビューを開き、[Override default setup] (デフォルトセットアップの上書き)チェックボックスをオンにして[Repository] (リポジトリー)フィールドを有効にします。
    3. [Repository] (リポジトリー)フィールドに、ローカルプロキシのURLと、このプロキシに定義した認証情報を入力します。
    4. [Check Connection] (接続のチェック)をクリックして接続ステータスを検証します。
  5. [Dynamic distribution settings] (ダイナミックディストリビューションの設定)ビューに戻り、[Dynamic distribution setup] (ダイナミックディストリビューションの設定)をクリックします。
  6. [Create new dynamic configuration] (ダイナミック設定の新規作成)ラジオボタンを選択し、[Refresh] (最新の情報に更新)をクリックして接続先Clouderaリポジトリーで利用可能なClouderaバージョンを[Version] (バージョン)ドロップダウンリストに表示します。
  7. Studioで使う設定の生成対象とするClouderaバージョンを選択します。
  8. [Finish] (終了)をクリックします。

    Studioではこのディストリビューションの設定ファイルをClouderaリポジトリーから取得し始めます。この取得にはしばらく時間がかかることがあります。

    完了したら[Dynamic distribution setup] (ダイナミックディストリビューションの設定)ウィザードは自動的に閉じ、[Dynamic distribution settings] (ダイナミックディストリビューションの設定)ビューに戻ります。新しく生成された「ダイナミック」ディストリビューションは、[Version] (バージョン)リストに表示されます。

  9. 必要に応じてこのオペレーションを繰り返し、別のバージョンをさらに追加することもできます。または、[Apply and Close] (適用して閉じる)をクリックして[Project settings] (プロジェクト設定)ダイアログボックスを閉じます。

タスクの結果

この新しいバージョンは、Talend Studioと共に提供される組み込みディストリビューションと同様に使用できます。それによって次の操作が可能となります。
  • このダイナミックディストリビューションへの接続を[Repository] (リポジトリー)で設定し、Talendジョブでこの接続を再利用する。

  • このダイナミックディストリビューションをジョブで直接使用する。ジョブをビルドしてZip内に実行可能ファイルを生成し、実行可能ファイルをWindowsで実行する必要がある場合は、.batスクリプトを使用せず、.ps1スクリプトを使用します。

ジョブをエクスポートする場合は通常、[Repository] (リポジトリー)で定義した接続などの依存項目と共にエクスポートできますが、ダイナミックディストリビューションへの接続を同様にエクスポートすることはできません。接続をエクスポートする必要がある場合は、ダイナミックビッグデータプラットフォームディストリビューションの設定をエクスポートまたはインポートするを参照してください。