[Simple statistics] (シンプル統計) - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

この分析は、特定のカテゴリーに含まれるレコードの数(行数、null値の数、重複を除く一意値の数、重複値の数、空白フィールドの数など)に対してシンプル統計を行います。

  • [Blank Count] (空白カウント): 空白の行数をカウントします。「空白」とはnullではないテキストデータで、空白のみが含まれるものです。Oracleは空の文字列とnull値を区別しません。

    VerticaのLONG VARCHARデータ型はサポートされていません。

  • [Default Value Count] (デフォルト値カウント): デフォルト値の数をカウントします。
  • [Distinct Count] (重複を除いたカウント): カラム内の重複を除いた値の数をカウントします。
  • [Duplicate Count] (重複カウント): 2回以上出現する値の数をカウントします。次の関係があります: 重複カウント + ユニークなカウント = 重複を除いたカウント。たとえば、a、a、a、a、b、b、c、d、e => 値9、重複を除いた値5、ユニーク値3、重複値2となります。
  • [Null Count] (NULL値カウント): nullの行数をカウントします。
  • 行カウント: 行数をカウントします。
  • [Unique Count] (ユニークカウント): 1回しか出現しない重複を除いた値の数をカウントします。これは重複を除いたカウント以下になります。

どのデータベースでも選択できるインジケーターを次のテーブルに示します。

データ型 数字 Text Date その他
分析エンジンのタイプ Java SQL Java SQL Java SQL Java SQL
行カウント
[Null Count] (NULL値カウント)
[Distinct Count] (重複を除いたカウント)
[Unique Count] (ユニークカウント)
[Duplicate Count] (重複カウント)
[Blank Count] (空白カウント)
[Default Value Count] (デフォルト値カウント) * * * * * * * *
*データベーステーブルにデフォルト値の制限がある場合のみ