集計統計 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2023-09-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

数値データに対して統計分析を行います。これには中央値や平均値などの中心傾向の計算、四分位範囲や範囲などの統計的ばらつきの計算が含まれます。

  • [Mean] (平均): レコードの平均を計算します。
  • [Median] (中央): 母集団や確率分布などのサンプルのうち、上半分と下半分を分けている値を計算します。
  • [Inter quartile range] (四分位範囲): 第1四分位数と第3四分位数の差を計算します。
  • [Lower quartile (First quartile)] (下位四分位数(第1四分位数)): データの第1四分位数、すなわちデータの低い方から25%を計算します。
  • [Upper quartile (Third quartile)] (上位四分位数(第3四分位数)): データの第3四分位数、すなわちデータの高い方から25%を計算します。
  • [Range] (範囲): 最大値と最小値の差を計算します。

集計統計インジケーターを使ってDB2データベースをプロファイリングする場合、JavaとSQLエンジンの間で分析結果が僅かに異なる場合があります。これはデータベースの種類によってインジケーターの計算方法が異なるためです。また、TalendではJavaの使用に際して特別なファンクションを使用します。

どのデータベースでも選択できるインジケーターを次のテーブルに示します。

データ型 数字 Text Date その他
分析エンジンのタイプ Java SQL Java SQL Java SQL Java SQL
平均
中央
四分位範囲
上位四分位数
[Range] (範囲)
最小値
最大値