Hadoopメタデータを管理 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

[Repository] (リポジトリー)ツリービューでは、[Metadata] (メタデータ)フォルダーの[Hadoop cluster] (Hadoopクラスター)ノードの下に、HDFS、Hive、HBaseなど、Hadoopエレメントへの接続のメタデータが含まれます。これにより、特定のHadoopディストリビューションに設定した接続のプロパティを一元化し、それらのプロパティを再利用してHadoopの各エレメントに個別の接続を作成できます。

[Repository] (リポジトリー)ツリービューの[Metadata] (メタデータ)をクリックして、該当するフォルダーを展開します。各接続ノードには、セットアップした接続とスキーマが含まれます。これらの接続ノードの中に、[Hadoop cluster] (Hadoopクラスター)ノードがあります。

次のセクションでは、[Hadoop cluster] (Hadoopクラスター)ノードを使って下記をセットアップする方法について詳しく説明します。

  • HBase接続

  • HCatalog接続

  • HDFSファイルスキーマ

  • Hive接続

Clouderaの分析データベース、Impalaへの接続を作成する必要がある場合、[Repository] (リポジトリー)[Metadata] (メタデータ)ノードの下にある[DB connection] (データベース接続)ノードを使用する必要があります。その設定はHive接続の設定と似ていますが、Hive接続ほど複雑ではありません。

この[DB connection] (DB 接続)ノードの詳細は、データベースメタデータを一元管理をご覧ください。