Hadoopメタデータの管理 - 7.3

Talend Big Data Platform Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発

[Repository] (リポジトリー)ツリービューでは、[Metadata] (メタデータ)フォルダーの[Hadoop cluster] (Hadoopクラスター)ノードの下に、HDFS、Hive、HBaseなど、Hadoopエレメントへの接続のメタデータが含まれます。これにより、特定のHadoopディストリビューションに設定した接続プロパティを一元化し、それらのプロパティを再利用してHadoopの各エレメントに個別の接続を作成できます。

[Repository] (リポジトリー)ツリービューの[Metadata] (メタデータ)をクリックして、該当するフォルダーを展開します。各接続ノードには、セットアップした接続とスキーマが含まれます。これらの接続ノードの中に、[Hadoop cluster] (Hadoopクラスター)ノードがあります。

次のセクションでは、[Hadoop cluster] (Hadoopクラスター)ノードを使って下記をセットアップする方法について詳しく説明します。

  • HBase接続

  • HCatalog接続

  • HDFSファイルスキーマ

  • Hive接続

Clouderaの分析データベース、Impalaへの接続を作成する必要がある場合、[Repository] (リポジトリー)[Metadata] (メタデータ)ノードの下にある[DB connection] (DB接続)ノードを使用する必要があります。その設定はHive接続の設定と似ていますが、Hive接続ほど複雑ではありません。

この[DB connection] (DB 接続)ノードの詳細は、『データベースメタデータを一元管理』を参照してください。