Hiveのプロファイリング - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio
Hiveへの接続の作成の説明に従い、Hadoopディストリビューションへの接続を経由してHive接続を作成したら、Hiveテーブル全てのデータを分析することができます。

手順

  1. [DQ Repository] (DQリポジトリ)ツリービューの[Metadata] (メタデータ)ノードで、Hive接続を参照します。
  2. Hive接続を右クリックし、[Overview Analysis] (概要分析)を選択します。

    この分析ではデータベースコンテンツのプロファイリングを行い、テーブルごとにテーブル数と行数の概要を示します。詳細は、データベースの分析を参照して下さい。

  3. Hiveテーブルを右クリックし、メニューにリストされている分析のいずれかを選択します。

    ウィザードが表示され、選択した分析を作成する手順が段階的に説明されます。続いて、必要に応じて分析対象カラムにインジケーターを割り当てることができます。