一致しない値の除去 - 6.5

データのクレンジング

EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発
データクオリティとプレパレーション
データクオリティとプレパレーション > データクレンジング
emailカラムで使用した電子メールパターンでは、一部のレコードが標準の電子メール形式に準拠していないことが示されました。既製ジョブを生成して、カラムから一致しない行を取り出すことができます。

手順

  1. Profilingパースペクティブで、エディターの下部にある[Analysis Results] (分析結果)をクリックします。
  2. emailカラムのPattern Matching (パターンマッチング)結果に示されるグラフのバーまたは数値結果を右クリックし、[Generate Job] (ジョブの生成)をクリックします。
  3. 開いたダイアログボックスで、[Generate an ETL Job to handle rows] (ETLジョブを生成して行を処理する)を選択します。

    統合パースペクティブに生成されたジョブが開きます。

    このジョブはExtract Transform Load (抽出、変換、ロード)プロセスを使用して、2つの個別の出力ファイルに、パターンと一致する/一致しない有効/無効な電子メール行を書き込みます。

  4. ジョブを保存し、F6を押して実行します。

タスクの結果

emailカラムの有効な行および無効な行が、定義した出力ファイルに書き込まれます。

出力ファイルを別のTalendコンポーネントに置き換えて、有効な電子メール行または無効な電子メール行を取り出し、データベースに書き込むこともできます。

次のタスク

同じ手順を使って、postalカラムからも無効な行を取り出せます。

Profilingパースペクティブを使用して、破損した、不完全、または不正確なデータを特定し、削除するプロセスについては、「 データクレンジング 」(Talend Studioユーザーガイド)を参照して下さい。