Hive経由によるADLS Databricksファイルへのプロファイリング分析の作成 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Hiveを介してADLS Databricksクラスターへの接続を作成した後は、特定のファイルでプロファイリング分析を作成できます。

始める前に

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで、[Metadata] (メタデータ) > [DB Connections] (データベース接続) > [JDBC connection] (JDBC接続) > [Tables] (テーブル)と展開します。
  2. [Columns] (カラム)フォルダーで、分析するカラムを選択して右クリックします
    ヒント: すべてのカラムで分析を作成する場合は、テーブル名を右クリックします。
  3. [Column Analysis] (カラム分析)にマウスを重ね、必要とする分析タイプを選択します。
    [Create New Analysis] (新しい分析を作成)ウィザードが表示されます。
  4. 名前を入力して[Finish] (終了)をクリックします。他のフィールドはオプションです。
    選択したADLSファイルの新しい分析が自動的に作成され、分析エディター内で開きます。選択した分析タイプに応じて、カラムに対してインジケーターが自動的に割り当てられます。

    分析はHiveテーブルに適用されますが、外部テーブルメカニズムを使い、ADLSからのデータで統計を計算します。外部テーブルは、Hive外の元のファイルにデータを保持します。分析のために選択したADLSファイルは削除され、分析は実行できなくなります。

  5. 必要であれば次の操作を行います。
    • 分析するカラムを変更します。[Data Preview] (データプレビュー)タブで、[Select Columns] (カラムを選択)をクリックします。
    • インジケーターか新しいパターンをカラムに追加します。[Analyzed Columns] (分析済みカラム)タブで、[Select Indicators] (インジケーターを選択)をクリックします。
  6. 分析を実行し、結果をエディターの[Analysis Results] (分析結果)ビューに表示します。

次のタスク

この分析でレポートを作成できます。特定の分析のレポートの作成をご覧ください。