分析を実行してプロファイリング結果を表示 - 8.0

Data Qualityジョブと分析の例

Version
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
データクオリティとプレパレーション
Last publication date
2023-12-14

手順

  1. 分析エディターでカラムの分析を保存し、F6を押してカラム分析を実行します。
    分析エディターの右にある[Graphics] (グラフ)パネルに、いくつかのグラフが表示され、パターンマッチングの結果を含む、カラム分析の結果が示されます。
  2. 分析エディターの下部にある[Analysis Results] (分析結果)タブをクリックし、より詳細な結果ビューにアクセスできます。
    これらの結果には、分析されたカラムに関して生成されたグラフ、統計結果の詳細を含むテーブル、パターンパッチングの結果が示されます。

タスクの結果

特定カラムのパターン統計の概要。

パターンマッチングの結果は、メールのレコードの約10%が標準のメールパターンではないことを示しています。シンプル統計の結果は、メールのレコードの約8%が空白であり、約5%が重複していることを示しています。パターン頻度の結果は、それぞれの個別のパターンについて最も頻度の高いレコードの数を示しています。これはデータに一貫性がないことを示しており、キャンペーンを始める前に、メールデータの訂正とクレンジングが必要なことを示しています。

postalカラムの結果は次の図のようになります。

特定カラムのパターン統計の概要。

postalカラムの結果セットは、米国の標準の郵便番号コードに一致するレコード数と一致しないレコード数を示しています。結果セットは、空白数と重複数、およびそれぞれの個別のパターンについて最も頻度が高いレコードの数も示しています。これらの結果は、データにあまり一貫性がないことを示しています。

そのため一部の顧客とはメールでも郵便でも連絡が取れません。これらの結果は、データにあまり一貫性がないため、訂正が必要なことを明確に示しています。