メイン コンテンツをスキップする 補完的コンテンツへスキップ

離散データの分析

この分析では、数値データを分析できます。この分析で作成するカラム分析では、数値データに適したインジケーターがデフォルトでカラムに割り当てられています。

離散データは特定の値のみ取ることができますが、値の数に制限はありません。連続データは離散データの反対で、定義済みの個別値に限定されず、連続する範囲にまたがる任意の値を取ることができます。

この分析では[Bin Frequency] (Bin頻度)インジケーターを使用しますが、必要に応じて連続データを離散Bin (範囲)に変換するためには、このインジケーターをさらに設定する必要があります。

始める前に

Talend StudioProfilingパースペクティブでデータベース接続が少なくとも1つ設定されていること。詳細は、データベースに接続をご覧ください。

離散データの分析を定義

Procedure

  1. [DQ Repository] (DQリポジトリー)ツリービューで[Metadata] (メタデータ)を展開し、分析を行う数値カラムに移動します。
  2. 数値カラムを右クリックし、[Column Analysis] (カラム分析)> [Discrete data Analysis] (離散データ分析)と選択します。
    この例では、顧客年齢をいくつかの離散Binまたは年齢値の範囲に変換します。
    [New Analysis] (新しい分析)ウィザードが開きます。
  3. [Name] (名前)フィールドに、分析の名前を入力します。
    情報メモImportant:

    ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " " " < > といった特殊文字は項目名に使用しないでください。

    ファイルシステムでは、これらの文字はすべて"_"に置き換えられ、重複する項目が作成されてしまう場合があります。

  4. 分析メタデータを設定し、[Finish] (終了)をクリックします。
    分析エディター内に分析が開き、[Simple Statistics] (シンプル統計)および[Bin Frequency] (Bin頻度)インジケーターが数値カラムに自動的に割り当てられます。
  5. [Bin Frequency] (Bin頻度)インジケーターをダブルクリックし、[Indicator settings] (インジケーターの設定)ダイアログボックスを開きます。
    [インジケーター設定]ダイアログボックスの概要。
  6. 該当するフィールドで、Binの最小値と最大値、Binの数を設定します。
    Binの数を0に設定すると、Binは作成されません。インジケーターはカラムの各値の頻度を計算します。
  7. [Set ranges manually] (範囲を手動で設定)チェックボックスをオンにします。
    [Create Bins] (Binの作成)ダイアログボックスの下部にある4つの読み取り専用フィールドには、TableauがBinのサイズの推奨に使用するデータが表示されます。Binのサイズを手動で設定する場合に、これらの値を参考にすることもできます。
    連続数値データが離散Binに集約されます。テーブルには4つの範囲が、推奨するBinサイズと共にリスト表示されます。最小値は最初のBinの先頭で、最大値は最後のBinの末尾です。各Binのサイズは、最小値と最大値の差をBinの数で除することで決定されます。
    Binのサイズを手動で設定する場合、これらの値はいつでも変更できます。範囲の数がアップデートされると、[number of bins] (Binの数)フィールドの値は自動的にアップデートされます。

分析の実行と詳細な分析結果へのアクセス

Procedure

  1. 分析を実行します。
    エディターが[Analysis Results] (分析結果)タブに切り替わります。
    [Bin頻度]インジケーターと[シンプル統計]インジケーター用のテーブルとグラフィック。
    分析により、無制限で連続する範囲の年齢値から、限定された可能な離散値のセットによる年齢範囲が作成されます。
  2. 結果テーブルまたはチャートのいずれかのデータ行(この例では最初の年齢範囲)を右クリックし、[View rows] (行を表示)を選択して、分析されたデータのビューにアクセスします。
    [データエクスプローラー]パースペクティブからの分析済みデータの概要。
    SQLエディターが開き、28歳から39歳までの顧客全員がリスト表示されます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。