データの異常を識別 - 8.0

Talend Open Studio for Data Quality 入門ガイド

Version
8.0
Language
日本語 (日本)
EnrichDitaval
Open Studio for Data Quality
Product
Talend Open Studio for Data Quality
Module
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データプロファイリング

このユースケースでは、StudioのProfilingパースペクティブを使って顧客のメールアドレスと電話番号を分析する方法を説明します。カラムに標準のインジケーターとパターンを使用し、一致/非一致の住所データを表示します。

続いて、Data Explorerパースペクティブを使って、一致しないデータを参照できます。

顧客データのプロファイリングのシーケンスは、以下の手順で行われます。

手順

  1. 顧客のメールアドレスと電話番号に基づいて、カラム分析を作成します。
  2. 分析エディターからの顧客データが含まれるデータベースに接続します。
  3. 行、空白、重複カウントなど、データに関する単純な統計を示すインジケーターを追加します。
  4. メールアドレスと電話番号を照合するための標準パターンを追加します。
  5. 分析を実行し、結果をテーブルとグラフに表示します。
  6. 分析されたデータのビューにアクセスし、無効なレコードを確認します。