関数依存分析の確定と実行 - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

手順

  1. 必要に応じて、[Analysis Parameter] (分析パラメーター)ビューの[Number of connections per analysis] (分析ごとの接続数)フィールドで、選択されたデータベースに対して許可する分析ごとの同時接続数を設定します。
    この数値はデータベースの利用可能リソース、つまりデータベースがサポートできる同時接続数に基づいて設定します。
  2. 分析を保存し、[F6]を押して実行します。

    情報メッセージが開き、操作が進行中であることが確認できます。また、分析エディターが[Analysis Results] (分析結果)ビューに切り替わります。

    この関数従属性分析は、cityカラムに存在するレコードとstate_provinceカラムに存在するレコードを相互評価し、都市名がリスト表示されている州名と一致するかどうか(またはその逆)を調べます。[%Match] (%一致)に返された結果は、各決定要素カラムの機能的な依存性の強さを示します。一致しないレコードは、赤で表示されます。
    結果テーブルの#Matchカラムには、各分析対象カラムの重複を除いた決定要素値の数がリスト表示されます。分析結果の#rowカラムには、決定要素属性と依存属性の間にある実際の関係がリスト表示されます。この例では、結果テーブルの最初の行にある#Matchは重複を除いた都市の数を表し、#rowは重複を除いたペア(cityとstate_province)を表します。この2つの数値が同等ではないため、ここでの関数依存性は部分的なもので、その比率(%Match)は実際の関数依存の強さを測定するものです。この2つの数値が等しい場合、関数依存性が「厳格」になります。たとえば、各都市は各州で1回のみ表示されるようになります。
    注: 2つの分析対象カラムのいずれかにNULL値が存在する場合は、「依存性の強さ」が弱まります。システムはNULL値を無視せず、関数依存に違反する値として計算します。
  3. [Analysis Results] (分析結果)で、いずれかの依存性の行を右クリックし、次のオプションを選択します。

    オプション

    内容...

    [View valid/invalid rows] (有効な行/無効な行を表示)

    関数従属性分析を基に測定した有効な行、または無効な行のリスト(SQLエディター内)にアクセスします。

    [View valid/invalid values] (有効な値/無効な値を表示)

    関数従属性分析を基に測定した有効な値、または無効な値のリスト(SQLエディター内)にアクセスします。

    [View detailed valid/detailed invalid values] (有効な値の詳細/無効な値の詳細を表示)

    関数従属性分析を基に測定した有効な値、または無効な値の詳細なリスト(SQLエディター内)にアクセスします。

    SQLエディターのエディターツールバーにある保存アイコンをクリックすると実行されたクエリを保存し、[DQ Repository] (DQリポジトリ)ツリービューの[Libraries] (ライブラリ) > [Source Files] (ソースファイル)フォルダーの下にリスト表示することができます。詳細は、インジケーターで実行したクエリの保存を参照して下さい。