[Simple statistics] (シンプル統計) - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

この分析は、特定のカテゴリに含まれるレコードの数(行数、null値の数、重複を除く一意値の数、重複値の数、空白フィールドの数など)に対してシンプル統計を行います。

  • [Blank Count] (空白カウント): 空白の行数をカウントします。「空白」とはnullではないテキストデータで、空白のみが含まれるものです。Oracleは空の文字列とnull値を区別しません。

  • [Default Value Count] (デフォルト値カウント): デフォルト値の数を数えます。

  • [Distinct Count] (重複を除いたカウント): カラム内の重複を除いた値の数をカウントします。

  • [Duplicate Count] (重複カウント): 2回以上出現する値の数をカウントします。次の関係があります: 重複カウント + ユニークなカウント = 重複を除いたカウント。たとえば、a、a、a、a、b、b、c、d、e =>値9、重複を除いた値5、ユニーク値3、重複値2となります。

  • [Null Count] (NULL値カウント): nullの行数をカウントします。

  • 行カウント: 行数をカウントします。

  • [Unique Count] (ユニークカウント): 1回しか出現しない重複を除いた値の数をカウントします。これは重複を除いたカウント以下になります。