Hiveのプロファイリング - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発
Hiveへの接続の作成の説明に従い、Hadoopディストリビューションへの接続を経由してHive接続を作成したら、Hiveテーブルすべてのデータを分析できます。

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューの[Metadata] (メタデータ)ノードで、Hive接続を参照します。
  2. Hive接続を右クリックし、[Overview Analysis] (概要分析)を選択します。

    この分析ではデータベースコンテンツのプロファイリングを行い、テーブルごとにテーブル数と行数の概要を示します。詳細は、データベースの分析を参照してください。

  3. Hiveテーブルを右クリックし、メニューにリスト表示されている分析のいずれかを選択します。

    ウィザードが表示され、選択した分析を作成する手順が段階的に説明されます。続いて、必要に応じて分析対象カラムにインジケーターを割り当てることができます。