分析を実行してプロファイリング結果を表示する - 7.3

Data Qualityジョブと分析の例

EnrichVersion
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
データクオリティとプレパレーション

手順

  1. 分析エディターでカラムの分析を保存し、F6を押してカラム分析を実行します。
    分析エディターの右にある[Graphics] (グラフ)パネルに、いくつかのグラフが表示され、パターンマッチングの結果を含む、カラム分析の結果が示されます。
  2. 分析エディターの下部にある[Analysis Results] (分析結果)タブをクリックし、より詳細な結果ビューにアクセスできます。
    これらの結果には、分析されたカラムに関して生成されたグラフ、統計結果の詳細を含むテーブル、パターンパッチングの結果が示されます。

タスクの結果

パターンマッチングの結果は、電子メールのレコードの約10%が標準の電子メールパターンではないことを示しています。単純統計の結果は、電子メールのレコードの約8%が空白であり、約5%が重複していることを示しています。パターン頻度の結果は、それぞれの個別のパターンについて最も頻度の高いレコードの数を示しています。これはデータに一貫性がないことを示しており、キャンペーンを始める前に、電子メールデータの訂正とクレンジングが必要なことを示しています。

postalカラムの結果は次の図のようになります。

postalカラムの結果セットは、米国の標準郵便番号形式に一致するレコードと一致しないレコードの数を示しています。結果セットは、空白数と重複数、およびそれぞれの個別のパターンについて最も頻度が高いレコードの数も示しています。これらの結果は、データにあまり一貫性がないことを示しています。

そのため一部の顧客とは電子メールでも郵便でも連絡が取れません。これらの結果は、データにあまり一貫性がないため、訂正が必要なことを明確に示しています。