[Advanced statistics] (詳細統計) - Cloud - 8.0

Talend Studioユーザーガイド

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-04-16
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

最確値と最も頻度の高い値を計算し、頻度テーブルを生成します。詳細統計の主なものには次の値が含まれます:

  • モード: 最頻値を計算します。数値データや連続データに対しては、インジケーターのパラメーターでBinを設定できます。これは「平均」や「中央値」とは異なります。カテゴリーカルな属性を調べるのに適しています。
  • 値の頻度個別のレコードから最も頻度の高い値の数を計算します。
  • 他にも「日付」、「週」、「月」、「四半期」、「年」、「Bin」で日付と数値データを集約するすべての値の頻度インジケーターが利用できます。
  • 値の低頻度: 個別のレコードから頻度の低いレコードの数を計算します。
  • 他にも「日付」、「週」、「月」、「四半期」、「年」、「Bin」で日付と数値データを集約する値の低頻度インジケーターがすべて利用できます。「Bin」とは一定間隔で数値データを集約したものです。

どのデータベースでも選択できるインジケーターを次のテーブルに示します。

インジケーター Java解析エンジンでサポートされているデータ型 SQL解析エンジンでサポートされているデータ型
モード
  • Number
  • Text
  • Date
  • Number
  • Text
  • Date
値の低頻度
  • Number
  • Text
  • Date
  • Number
  • Text
  • Date
日付低頻度
  • 日付(ただし時間は除く)
  • 日付(ただし時間は除く)
週低頻度
  • 日付(ただし時間は除く)
  • 日付(ただし時間は除く)
月低頻度
  • 日付(ただし時間は除く)
  • 日付(ただし時間は除く)
四半期低頻度
  • 日付(ただし時間は除く)
  • 日付(ただし時間は除く)
年低頻度
  • 日付(ただし時間は除く)
  • 日付(ただし時間は除く)
Bin低頻度
  • Number
  • Number