tHiveConnectionの設定 - 7.3

Hive

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Hive
データガバナンス > サードパーティーシステム > DBコンポーネント > Hive
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Hive

手順

  1. tHiveConnectionをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
  2. [Property type] (プロパティタイプ)リストから、[Built-in] (組み込み)を選択します。[Repository] (リポジトリー)で使う接続を作成した場合は、[Repository] (リポジトリー)を選択し、ボタンをクリックして[Repository content] (リポジトリーの内容)ダイアログボックスを開いてその接続を選択します。これでこのジョブの接続情報のセットがStudioで再使用されます。
    Hadoop接続を[Repository] (リポジトリー)で作成する方法については、『 Talend Open Studio for Big Data Getting Started Guide 』のHadoopクラスターについて説明している章を参照してください。
  3. [Version] (バージョン)エリアで、使用するHadoopディストリビューションとそのバージョンを選択します。リストに対応するディストリビューションが見つからない場合は、[Custom] (カスタム)を選択し、Studioで公式にはサポートされていないHadoopディストリビューションに接続します。
    この[Custom] (カスタム)オプションを使用する手順の例は、カスタムHadoopディストリビューションへの接続を参照してください。
  4. [Connection] (接続)エリアに、使用するHiveデータベースへの接続パラメーターを入力します。
  5. [Name node] (名前ノード)フィールドに、使用するディストリビューションのマスターノードのNameNodeを入力します。たとえば、talend-hdp-all:50300のように入力します。 WebHDFSを使用している場合、ロケーションはwebhdfs://masternode:portnumberとなります。WebHDFS with SSLはまだサポートされていません。
  6. [Job tracker] (ジョブトラッカー)フィールドに、ディストリビューションのジョブトラッカーの場所を入力します。たとえば、hdfs://talend-hdp-all:8020と入力します。
    JobTrackerのジョブという用語は、http://hadoop.apache.org/のApacheドキュメンテーションで説明されているMRまたはMapReduceジョブを指し示しています。