対象製品...Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
Hiveを介してADLS Databricksクラスターへの接続を作成した後は、特定のファイルでプロファイリング分析を作成できます。
手順
-
[DQ Repository] (DQリポジトリー)ツリービューで、[JDBC connection] (JDBC接続)と展開します。
-
[Columns] (カラム)フォルダーで、分析するカラムを選択して右クリックします
ヒント: すべてのカラムで分析を作成する場合は、テーブル名を右クリックします。
-
[Column Analysis] (カラム分析)にマウスを重ね、必要とする分析タイプを選択します。
[Create New Analysis] (新しい分析を作成)ウィザードが表示されます。
-
名前を入力して[Finish] (終了)をクリックします。他のフィールドはオプションです。
選択したADLSファイルの新しい分析が自動的に作成され、分析エディター内で開きます。選択した分析タイプに応じて、カラムに対してインジケーターが自動的に割り当てられます。
分析はHiveテーブルに適用されますが、外部テーブルメカニズムを使い、ADLSからのデータで統計を計算します。外部テーブルは、Hive外の元のファイルにデータを保持します。分析のために選択したADLSファイルは削除され、分析は実行できなくなります。
-
必要であれば次の操作を行います。
- 分析するカラムを変更します。[Data Preview] (データプレビュー)タブで、[Select Columns] (カラムを選択)をクリックします。
- インジケーターか新しいパターンをカラムに追加します。[Analyzed Columns] (分析済みカラム)タブで、[Select Indicators] (インジケーターを選択)をクリックします。
-
分析を実行し、結果をエディターの[Analysis Results] (分析結果)ビューに表示します。
次のタスク
この分析でレポートを作成できます。
特定の分析のレポートの作成をご覧ください。