メイン コンテンツをスキップする 補完的コンテンツへスキップ

Hive経由によるADLS Databricksファイルへのプロファイリング分析の作成

Hiveを介してADLS Databricksクラスターへの接続を作成した後は、特定のファイルでプロファイリング分析を作成できます。

始める前に

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで、[Metadata] (メタデータ) > [DB Connections] (データベース接続) > [JDBC connection] (JDBC接続) > [Tables] (テーブル)と展開します。
  2. [Columns] (カラム)フォルダーで、分析するカラムを選択して右クリックします
    情報メモヒント: すべてのカラムで分析を作成する場合は、テーブル名を右クリックします。
  3. [Column Analysis] (カラム分析)にマウスを重ね、必要とする分析タイプを選択します。
    [Create New Analysis] (新しい分析を作成)ウィザードが表示されます。
  4. 名前を入力して[Finish] (終了)をクリックします。他のフィールドはオプションです。
    選択したADLSファイルの新しい分析が自動的に作成され、分析エディター内で開きます。選択した分析タイプに応じて、カラムに対してインジケーターが自動的に割り当てられます。

    分析はHiveテーブルに適用されますが、外部テーブルメカニズムを使い、ADLSからのデータで統計を計算します。外部テーブルは、Hive外の元のファイルにデータを保持します。分析のために選択したADLSファイルは削除され、分析は実行できなくなります。

  5. 必要であれば次の操作を行います。
    • 分析するカラムを変更します。[Data Preview] (データプレビュー)タブで、[Select Columns] (カラムを選択)をクリックします。
    • インジケーターか新しいパターンをカラムに追加します。[Analyzed Columns] (分析済みカラム)タブで、[Select Indicators] (インジケーターを選択)をクリックします。
  6. 分析を実行し、結果をエディターの[Analysis Results] (分析結果)ビューに表示します。

次のタスク

この分析でレポートを作成できます。特定の分析のレポートの作成をご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。