Hiveへのデータベース接続を設定する - 7.3

Hive

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Hive
データガバナンス > サードパーティーシステム > DBコンポーネント > Hive
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Hive

このタスクについて

この例では、Azure HDInsightのバージョン3.6を使っています。

手順

  1. [Repository] (リポジトリー)ビューで[Metadata] (メタデータ)ドロップダウンメニューを展開します。
  2. [Db Connections] (DB接続)をクリックし、[Create Connection] (接続の作成)を右クリックします。
  3. 接続に名前を付けます。
  4. [Next] (次へ)をクリックします。
  5. 次の表のように接続をセットアップします。

    DBタイプ

    Hiveを選択します。

    [Hadoop Cluster] (Hadoopクラスター)

    [None] (なし)を選択します。

    [Distribution] (ディストリビューション)

    Horton Worksを選択します。

    HDInsightは、バックエンドでHorton Worksディストリビューションを活用しています。これにより、Horton Worksライブラリーを使ってHDInsighsに接続できるようになります。

    DBタイプ

    Hiveを選択します。

    Version (バージョン)

    Hortonworks Data Platform V2.6.0.3-8 [Built in]を選択します。

    [Hive Model] (Hiveモデル)

    [Standalone] (スタンドアロン)を選択します。

    [Login] (ログイン)

    [Password] (パスワード)

    [Server] (サーバー)

    必要に応じてフィールドに入力します。

    [Port] (ポート)

    443と入力します。

    デフォルトでは、HDInsightクラスターがプロキシの背後にあるため、プロキシポートを介して通信できます。

    [DataBase] (データベース)

    [default] (デフォルト)のままにします。

    [Additional JDBC Setting] (追加のJDBC設定)

    transportMode=http;ssl=true;httpPath=/hive2と入力します。ここで:
    • transportMode=httpは転送モードをデフォルトのHive JDBC転送モードではなく、HTTPに設定します。
    • SSL=trueはSSLを有効にします。
    • httpPath=/hive2はHTTPエンドポイントを設定します。
  6. [Test Connection] (接続をテストする)をクリックして、Talend Studioがクラスターに正しく接続することを確認します。