データの異常を識別する - 7.2

Talend Open Studio for Data Quality入門ガイド

EnrichVersion
7.2
EnrichProdName
Talend Open Studio for Data Quality
EnrichPlatform
Talend Studio
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データプロファイリング

このユースケースでは、StudioのProfilingパースペクティブを使用して顧客の電子メールアドレスと電話番号を分析する方法を説明します。カラムに標準のインジケーターとパターンを使用し、一致/非一致の住所データを表示します。

続いて、Data Explorerパースペクティブを使用して、一致しないデータを参照することができます。

顧客データのプロファイリングのシーケンスは、以下の手順で行われます。

手順

  1. 顧客の電子メールアドレスと電話番号に基づいて、カラム分析を作成します。
  2. 分析エディターからの顧客データが含まれるデータベースに接続します。
  3. 行、空白、重複カウントなど、データに関する単純な統計を示すインジケーターを追加します。
  4. 電子メールアドレスと電話番号を照合するための標準パターンを追加します。
  5. 分析を実行し、結果をテーブルとグラフに表示します。
  6. 分析されたデータのビューにアクセスし、無効なレコードを確認します。