メイン コンテンツをスキップする 補完的コンテンツへスキップ

離散データの分析を定義

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで[Metadata] (メタデータ)を展開し、分析を行う数値カラムに移動します。
  2. 数値カラムを右クリックし、[Column Analysis] (カラム分析)> [Discrete data Analysis] (離散データ分析)と選択します。
    この例では、顧客年齢をいくつかの離散Binまたは年齢値の範囲に変換します。
    [New Analysis] (新しい分析)ウィザードが開きます。
  3. [Name] (名前)フィールドに、分析の名前を入力します。
    情報メモ重要:

    ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " " " < > といった特殊文字は項目名に使用しないでください。

    ファイルシステムでは、これらの文字はすべて"_"に置き換えられ、重複する項目が作成されてしまう場合があります。

  4. 分析メタデータを設定し、[Finish] (終了)をクリックします。
    分析エディター内に分析が開き、[Simple Statistics] (シンプル統計)および[Bin Frequency] (Bin頻度)インジケーターが数値カラムに自動的に割り当てられます。
  5. [Bin Frequency] (Bin頻度)インジケーターをダブルクリックし、[Indicator settings] (インジケーターの設定)ダイアログボックスを開きます。
    [インジケーター設定]ダイアログボックスの概要。
  6. 該当するフィールドで、Binの最小値と最大値、Binの数を設定します。
    Binの数を0に設定すると、Binは作成されません。インジケーターはカラムの各値の頻度を計算します。
  7. [Set ranges manually] (範囲を手動で設定)チェックボックスをオンにします。
    [Create Bins] (Binの作成)ダイアログボックスの下部にある4つの読み取り専用フィールドには、TableauがBinのサイズの推奨に使用するデータが表示されます。Binのサイズを手動で設定する場合に、これらの値を参考にすることもできます。
    連続数値データが離散Binに集約されます。テーブルには4つの範囲が、推奨するBinサイズと共にリスト表示されます。最小値は最初のBinの先頭で、最大値は最後のBinの末尾です。各Binのサイズは、最小値と最大値の差をBinの数で除することで決定されます。
    Binのサイズを手動で設定する場合、これらの値はいつでも変更できます。範囲の数がアップデートされると、[number of bins] (Binの数)フィールドの値は自動的にアップデートされます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。