時間コリレーション分析結果の検討 - 7.0

コリレーション分析

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio

前提条件: 時間コリレーション分析がStudioのProfilingパースペクティブで定義され、実行されていること。

分析エディターの[Analysis Results] (分析結果)ビューで、次の手順に従います。

  1. [Graphics] (グラフ)、[Simple Statistics] (シンプル統計)、[Data](データ)のいずれかをクリックすると、生成されたグラフ、分析されたレコード数、実際に分析されたデータがそれぞれ表示されます。

[Graphics] (グラフ)ビューでは、チャートで非表示にする値のチェックボックスをオフにできます。

ガントチャートには、選択された名義カラムにリスト表示されている各国について、最小および最大の生年月日の範囲が表示されます。また、生年月日にNULL値を含んでいる範囲棒グラフが強調表示されます。

たとえば上のチャートでは、メキシコの最小生年月日が1910年で最大生年月日が2000年になっています。国がメキシコとなっている全データレコードのうち、41のレコードの生年月日がNULL値になっています。

また、表示する開始名義値にポインターを置き、表示する終了名義値にドラッグすれば、特定の生年月日範囲を選択できます。

生成されたグラフでは、次の操作が可能です。

  • チャートで非表示にする値のチェックボックスをオフにする。

  • いずれかの範囲棒グラフにポインターを置いて、その位置のコリレーションデータを表示させる。

  • いずれかの範囲棒グラフを右クリックし、次のオプションを選択する。

    オプション

    目的

    [Show in full screen] (全画面表示)

    生成されたグラフを全画面で開きます。

    [View rows] (行を表示)

    選択されたカラムにある、分析されたすべての行にアクセスします。

次の図は、選択された範囲棒グラフにおける相関するデータ値をリスト表示しているSQLエディターの例です。

SQLエディターのエディターツールバーにある保存アイコンをクリックすると実行されたクエリを保存し、[DQ Repository] (DQリポジトリ)ツリービューの[Libraries] (ライブラリ) > [Source Files] (ソースファイル)フォルダーの下にリスト表示することができます。詳細は、インジケーターで実行したクエリの保存を参照して下さい。

[Simple Statistics] (シンプル統計)ビューでは、特定のカテゴリに含まれる分析レコードの数(行数、重複を除いた一意値の数、重複値の数など)が表示されます。

[Data] (データ)ビューでは、実際に分析されたデータが表示されます。

テーブルの任意のカラムヘッダーをクリックすることで結果テーブルに表示されたデータを並べ替えることができます。