一致しない値の除去 - 7.3

Data Qualityジョブと分析の例

EnrichVersion
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
データクオリティとプレパレーション
emailカラムで使用した電子メールパターンでは、一部のレコードが標準の電子メール形式に準拠していないことが示されました。既製ジョブを生成して、カラムから一致しない行を取り出すことができます。

手順

  1. Profilingパースペクティブで、エディターの下部にある[Analysis Results] (分析結果)をクリックします。
  2. emailカラムのPattern Matching (パターンマッチング)結果に示されるグラフのバーまたは数値結果を右クリックし、[Generate Job] (ジョブの生成)をクリックします。

    統合パースペクティブが開き、生成されたジョブが示されます。

    このジョブはExtract Transform Load (抽出、変換、ロード)プロセスを使用して、2つの個別の出力ファイルに、パターンと一致する/一致しない有効/無効な電子メール行を書き込みます。

  3. ジョブを保存し、[F6]を押して実行します。

タスクの結果

emailカラムの有効な行および無効な行が、定義した出力ファイルに書き込まれます。

出力ファイルを別のTalendコンポーネントに置き換えて、有効な電子メール行または無効な電子メール行を取り出し、データベースに書き込むこともできます。

破損、不完全、または不正確なデータを特定して削除するためのプロファイリングProfilingパースペクティブの使用方法の詳細については、Talend Studioのユーザーガイドの[Data Cleansing] (データクレンジング)の章を参照してください。