Hadoop接続の一元化
このタスクについて
特定のHadoopディストリビューションへの接続を[Repository] (リポジトリー)でセットアップすると、同じHadoopディストリビューションを使用するたびに接続を設定する必要がなくなります。
[Hadoop cluster] (Hadoopクラスター)ノードからHDFS、HiveなどHadoopの個々のエレメントへの接続を作成する前に、Hadoopの接続を定義する必要があります。
-
Studio Talendがインストールされているクライアントマシンが、使用するHadoopクラスターのノードのホスト名を認識できることを確認する必要があります。そのためには、そのHadoopクラスターのサービスに使用するIPアドレス/ホスト名のマッピングエントリーをクライアントマシンのhostsファイルに追加します。
たとえば、Hadoopネームノードサーバーのホスト名がtalend-cdh550.weave.localで、IPアドレスが192.168.x.xの場合、マッピングエントリーは192.168.x.x talend-cdh550.weave.localとなります。
-
使用するHadoopクラスターが正しく構成され、実行されています。
-
Integrationパースペクティブがアクティブであること。
-
Studio TalendからMapRに接続する場合は、Studio Talendと同じマシンにMapRクライアントがインストールされており、MapRクライアントのライブラリーがそのマシンのPATH変数に追加されていることを確認します。MapRのドキュメンテーションによると、各OSバージョンに対応するMapRクライアントのライブラリーは、MAPR_INSTALL/hadoop/hadoop-VERSION/lib/nativeにあります。たとえばWindows版のライブラリーは、MapRクライアントのJARファイルにある\lib\native\MapRClient.dllになります。
[Repository] (リポジトリー)でHadoop接続を作成するには、以下のようにします:
手順
- Studio Talendの[Repository] (リポジトリー)ツリービューで、[Metadata] (メタデータ)を展開し、[Hadoop cluster] (Hadoopクラスター)を右クリックします。
- コンテキストメニューから[Create Hadoop cluster] (Hadoopクラスターの作成)を選択し、[Hadoop cluster connection] (Hadoopクラスターの接続)ウィザードを開きます。
- [Name] (名前)や[Description] (説明)など、この接続に関する一般情報を入力し、[Next] (次へ)をクリックして[Hadoop Configuration Import Wizard] (Hadoop設定インポートウィザード)ウィンドウを開きます。ここで手動または自動モードを選択して接続を設定します。
このページは役に立ちましたか?
このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。