システムインジケーターの設定 - 7.1

顧客データのプロファイリング

EnrichVersion
7.1
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発
データクオリティとプレパレーション
データクオリティとプレパレーション > データプロファイリング

手順

  1. 分析エディターの[Data preview] (データプレビュー)ビューで[Select indicators] (インジケーターの選択)をクリックし、[Indicator Selection] (インジケーター選択)ダイアログボックスを開きます。
  2. インジケーター名の横のセル内をクリックし、分析対象カラム用のインジケーターパラメーターを設定し、[OK]をクリックします。
    データの一貫性を調べるために、すべてのカラムの行数、空白数、重複数を確認します。emailカラムとpostalカラムにPattern Frequency Table (パターン頻度テーブル)インジケーターを使って、個別のパターンまたは値について最も頻度の高いレコードの数を計算します。

    それによって、[Analyzed Columns] (分析対象カラム)ビュー内のカラムにインジケーターが付加されます。

  3. Blank Count (空白数)インジケーターの横にあるオプションアイコンをクリックし、[Upper threshold] (上限のスレッショルド)フィールドを0に設定します。

    インジケーターのスレッショルドを定義すると、分析結果のnull値の数が赤色で示されるため大変便利です。