手順
-
tHiveConnectionをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
-
[Property type] (プロパティタイプ)リストから、[Built-in] (組み込み)を選択します。[Repository] (リポジトリー)で使う接続を作成した場合は、[Repository] (リポジトリー)を選択し、ボタンをクリックして[Repository content] (リポジトリーの内容)ダイアログボックスを開いてその接続を選択します。これでこのジョブの接続情報のセットがStudioで再使用されます。
Hadoop接続をリポジトリーで作成する方法は、Talend Big Data入門ガイドのHadoopクラスターに関する章をご覧ください。
-
[Version] (バージョン)エリアで、使用するHadoopディストリビューションとそのバージョンを選択します。リストに対応するディストリビューションが見つからない場合は、[Custom] (カスタム)を選択し、Studioで公式にはサポートされていないHadoopディストリビューションに接続します。
この[Custom] (カスタム)オプションを使用する手順の例は、カスタムHadoopディストリビューションへの接続をご覧ください。
- [Connection] (接続)エリアに、使用するHiveデータベースへの接続パラメーターを入力します。
- [Name node] (名前ノード)フィールドに、使用するディストリビューションのマスターノードのNameNodeを入力します。たとえば、talend-hdp-all:50300のように入力します。 WebHDFSを使用している場合、ロケーションはwebhdfs://masternode:portnumberとなります。WebHDFS with SSLはまだサポートされていません。
-
[Job tracker] (ジョブトラッカー)フィールドに、ディストリビューションのジョブトラッカーの場所を入力します。たとえば、hdfs://talend-hdp-all:8020と入力します。
JobTrackerのジョブという用語は、http://hadoop.apache.org/のApacheドキュメンテーションで説明されているMRまたはMapReduceジョブを指し示しています。