Hadoopメタデータの管理 - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

[Repository] (リポジトリ)ツリービューでは、[Metadata] (メタデータ)フォルダーの[Hadoop cluster] (Hadoopクラスター)ノードの下に、HDFS、Hive、HBaseなど、Hadoopエレメントへの接続のメタデータがグループ化されます。これにより、特定のHadoopディストリビューションに設定した接続プロパティを一元化し、それらのプロパティを再利用してHadoopの各エレメントに個別の接続を作成することができます。

[Repository] (リポジトリ)ツリービューの[Metadata] (メタデータ)をクリックして、該当するフォルダーを展開します。各接続ノードにセットアップした各種接続およびスキーマが集約されます。これらの接続ノードの中に、[Hadoop cluster] (Hadoopクラスター)ノードがあります。

次のセクションでは、[Hadoop cluster] (Hadoopクラスター)ノードを使って下記をセットアップする方法について詳しく説明します。

  • HBase接続

  • HCatalog接続

  • HDFSファイルスキーマ

  • Hive接続

  • Oozie接続.

Clouderaの分析データベース、Impalaへの接続を作成する必要がある場合、[Repository] (リポジトリ)の[Metadata] (メタデータ)ノードの下にある[DB connection] (DB接続)ノードを使用する必要があります。その設定はHive接続の設定と似ていますが、Hive接続ほど複雑ではありません。

この[DB connection] (DB 接続)ノードの詳細は、『データベースメタデータの一元管理』を参照して下さい。