[Advanced statistics] (詳細統計) - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

最確値と最も頻度の高い値を計算し、頻度テーブルを生成します。詳細統計の主なものには次の値が含まれます:

  • [Mode] (モード): 最頻値を計算します。数値データや連続データに対しては、インジケーターのパラメーターでBinを設定することができます。これは「平均」や「中央値」とは異なります。カテゴリカルな属性を調べるのに適しています。
  • [Value Frequency]: (値の頻度): 個別のレコードから最も頻度の高い値の数を計算します。
  • 他にも「日付」、「週」、「月」、「四半期」、「年」、「Bin」で日付と数値データを集約する全ての値の頻度インジケーターが利用できます。
  • [Value Low Frequency] (値の低頻度): 個別のレコードから頻度の低いレコードの数を計算します。
  • 他にも「日付」、「週」、「月」、「四半期」、「年」、「Bin」で日付と数値データを集約する値の低頻度インジケーターが全て利用できます。「Bin」とは一定間隔で数値データを集約したものです。