[Advanced statistics] (詳細統計) - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発

最確値と最も頻度の高い値を計算し、頻度テーブルを生成します。詳細統計の主なものには次の値が含まれます:

  • モード: 最頻値を計算します。数値データや連続データに対しては、インジケーターのパラメーターでBinを設定できます。これは「平均」や「中央値」とは異なります。カテゴリーカルな属性を調べるのに適しています。
  • 値の頻度個別のレコードから最も頻度の高い値の数を計算します。
  • 他にも「日付」、「週」、「月」、「四半期」、「年」、「Bin」で日付と数値データを集約するすべての値の頻度インジケーターが利用できます。
  • 値の低頻度個別のレコードから頻度の低いレコードの数を計算します。
  • 他にも「日付」、「週」、「月」、「四半期」、「年」、「Bin」で日付と数値データを集約する値の低頻度インジケーターがすべて利用できます。「Bin」とは一定間隔で数値データを集約したものです。

どのデータベースでも選択できるインジケーターを次のテーブルに示します。

データ型 数字 Text Date その他
分析エンジンのタイプ Java SQL Java SQL Java SQL Java SQL
[Mode] (モード)
値の低頻度
日付低頻度 * *
週低頻度 * *
月低頻度 * *
四半期低頻度 * *
年低頻度 * *
Bin低頻度
* 時間データ型を除く