Hiveメタデータの一元化 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

Hiveのデータベーステーブルを頻繁に使う場合は、Hiveデータベースへの接続情報とテーブルスキーマの詳細を[Repository] (リポジトリ)ツリービューの[Metadata] (メタデータ)フォルダーに一元化することができます。

[DB connection] (DB接続)モードでも同じことができますが、[Hadoop cluster] (Hadoopクラスター)ノードを使うことで特定のHadoopディストリビューションへの一元化された接続プロパティを効果的に使うことができます。

前提条件:

  • 使用するHadoopディストリビューションを起動し、ディストリビューションとHiveデータベースへの適切なアクセス権があるかどうかを確認します。

  • [Hadoop cluster] (Hadoopクラスター)ノードからHadoopディストリビューションへの接続を作成します。詳細は、Hadoop接続の一元化を参照して下さい。

ディストリビューションにMapRを使用し、HiveのバージョンがMapR 2.0.0またはMapR 2.1.2の場合は、Hive接続をセットアップする前に次の作業を行って下さい。

手順

  1. オペレーティングシステムによって異なるMapRクライアントパス(Windowsの場合は-Djava.library.path=maprclientpath\lib\native\Windows_7-amd64-64) を、対応する.ini ファイルに追加します。Talend Studioたとえば、Talend-Studio-win-x86_64.ini
  2. MapR 2.0.0の場合は、maprfs-0.1.jarというモジュールをインストールします。
    MapR 2.1.2の場合は、maprfs-0.20.2-2.1.2.jarおよびmaprfs-jni-0.20.2-2.1.2.jarというモジュールをインストールします。
  3. その後、Studioを再起動して変更を確定します。

タスクの結果

Foジュールのインストール方法は、『』『 Talendインストレーションおよびアップグレードガイド 』で外部モジュールの識別およびインストール方法に関する説明を参照して下さい。