パターンを設定 - 8.0

Talend Open Studio for Data Quality 入門ガイド

Version
8.0
Language
日本語 (日本)
EnrichDitaval
Open Studio for Data Quality
Product
Talend Open Studio for Data Quality
Module
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データプロファイリング
このカラム分析では、事前定義されたパターンを使用して、メールおよび電話番号のカラムの内容をそれぞれ、標準のメールおよび米国の電話番号パターンと照合します。これにより、メールと電話番号の内容、ストラクチャー、品質が定義され、標準形式に一致するデータと一致しないデータの割合がわかります。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで、Emailカラムの横にあるアイコンをクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  2. [Regex] (正規表現) > [internet] (インターネット)の順に展開し、[Email Address] (メールアドレス)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析対象カラム)セクションのカラムに追加されます。

  3. Phoneカラムの横にあるアイコンをクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  4. [Regex] (正規表現) > [phone] (電話)の順に展開し、[US phone numbers] (米国の電話番号)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析対象カラム)セクションのカラムに追加されます。

  5. [Email Address] (メールアドレス)[US phone numbers] (米国の電話番号)パターンの横にあるアイコンをクリックし、[Lower threshold (%)] (下限しきい値(%))フィールドを98.0に設定します。

    パターンに一致するレコードの数が98%を下回ると、分析結果の値が赤色で示されます。