tHiveConnectionの設定 - 7.3

Hive

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Hive
データガバナンス > サードパーティーシステム > DBコンポーネント > Hive
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Hive
Last publication date
2024-02-22

手順

  1. tHiveConnectionをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
  2. [Property type] (プロパティタイプ)リストから、[Built-in] (組み込み)を選択します。[Repository] (リポジトリー)で使う接続を作成した場合は、[Repository] (リポジトリー)を選択し、ボタンをクリックして[Repository content] (リポジトリーの内容)ダイアログボックスを開いてその接続を選択します。これでこのジョブの接続情報のセットがStudioで再使用されます。
    Hadoop接続をリポジトリーで作成する方法は、Talend Big Data入門ガイドHadoopクラスターに関する章をご覧ください。
  3. [Version] (バージョン)エリアで、使用するHadoopディストリビューションとそのバージョンを選択します。リストに対応するディストリビューションが見つからない場合は、[Custom] (カスタム)を選択し、Studioで公式にはサポートされていないHadoopディストリビューションに接続します。
    この[Custom] (カスタム)オプションを使用する手順の例は、カスタムHadoopディストリビューションへの接続をご覧ください。
  4. [Connection] (接続)エリアに、使用するHiveデータベースへの接続パラメーターを入力します。
  5. [Name node] (名前ノード)フィールドに、使用するディストリビューションのマスターノードのNameNodeを入力します。たとえば、talend-hdp-all:50300のように入力します。 WebHDFSを使用している場合、ロケーションはwebhdfs://masternode:portnumberとなります。WebHDFS with SSLはまだサポートされていません。
  6. [Job tracker] (ジョブトラッカー)フィールドに、ディストリビューションのジョブトラッカーの場所を入力します。たとえば、hdfs://talend-hdp-all:8020と入力します。
    JobTrackerのジョブという用語は、http://hadoop.apache.org/のApacheドキュメンテーションで説明されているMRまたはMapReduceジョブを指し示しています。