対象製品...
Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
数値データに対して統計分析を行います。これには中央値や平均値などの中心傾向の計算、四分位範囲や範囲などの統計的ばらつきの計算が含まれます。
- [Mean] (平均): レコードの平均を計算します。
- [Median] (中央): 母集団や確率分布などのサンプルのうち、上半分と下半分を分けている値を計算します。
- [Inter quartile range] (四分位範囲): 第1四分位数と第3四分位数の差を計算します。
- [Lower quartile (First quartile)] (下位四分位数(第1四分位数)): データの第1四分位数、すなわちデータの低い方から25%を計算します。
- [Upper quartile (Third quartile)] (上位四分位数(第3四分位数)): データの第3四分位数、すなわちデータの高い方から25%を計算します。
- [Range] (範囲): 最大値と最小値の差を計算します。
集計統計インジケーターを使ってDB2データベースをプロファイリングする場合、JavaとSQLエンジンの間で分析結果が僅かに異なる場合があります。これはデータベースの種類によってインジケーターの計算方法が異なるためです。また、TalendではJavaの使用に際して特別なファンクションを使用します。
どのデータベースでも選択できるインジケーターを次のテーブルに示します。
データ型 | 数字 | Text | Date | その他 | ||||
---|---|---|---|---|---|---|---|---|
分析エンジンのタイプ | Java | SQL | Java | SQL | Java | SQL | Java | SQL |
平均 |
|
|
|
|
|
|
|
|
中央 |
|
|
|
|
|
|
|
|
四分位範囲 |
|
|
|
|
|
|
|
|
上位四分位数 |
|
|
|
|
|
|
|
|
[Range] (範囲) |
|
|
|
|
|
|
|
|
最小値 |
|
|
|
|
|
|
|
|
最大値 |
|
|
|
|
|
|
|
|