システムインジケーターの設定 - 7.3

Data Qualityジョブと分析の例

EnrichVersion
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
データクオリティとプレパレーション

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで[Select indicators] (インジケーターの選択)をクリックし、[Indicator Selection] (インジケーター選択)ダイアログボックスを開きます。
  2. インジケーター名の横のセル内をクリックし、分析対象カラム用のインジケーターパラメーターを設定し、[OK]をクリックします。

    データの一貫性を調べるために、すべてのカラムの行数、空白数、重複数を確認します。emailカラムとpostalカラムにPattern Frequency Table (パターン頻度テーブル)インジケーターを使って、個別のパターンまたは値について最も頻度の高いレコードの数を計算します。

    それによって、[Analyzed Columns] (分析対象カラム)セクション内のカラムにインジケーターが付加されます。

  3. [Blank Count] (空白数)インジケーターの横にあるアイコンをクリックし、[Upper threshold] (上限のスレッショルド)フィールドを0に設定します。

    インジケーターのスレッショルドを定義すると、分析結果のnull値の数が赤色で示されるため大変便利です。