パターンを設定 - 7.3

Talend Data Fabric 入門ガイド

Version
7.3
Language
日本語
Operating system
Data Fabric
Product
Talend Data Fabric
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Last publication date
2023-07-24
このカラム分析では、事前定義されたパターンを使用して、メールおよび電話番号のカラムの内容をそれぞれ、標準のメールおよび米国の電話番号パターンと照合します。これにより、メールと電話番号の内容、ストラクチャー、品質が定義され、標準形式に一致するデータと一致しないデータの割合がわかります。

始める前に

  • Studioで Profiling パースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで、Emailカラムの横にあるアイコンをクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  2. [Regex] (正規表現) > [internet] (インターネット)の順に展開し、[Email Address] (メールアドレス)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析済みカラム)セクションのカラムに追加されます。

  3. Phoneカラムの横にあるアイコンをクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  4. [Regex] (正規表現) > [phone] (電話)の順に展開し、[US phone numbers] (米国の電話番号)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析済みカラム)セクションのカラムに追加されます。

  5. [Email Address] (メールアドレス)[US phone numbers] (米国の電話番号)パターンの横にあるアイコンをクリックし、[Lower threshold (%)] (下限しきい値(%))フィールドを98.0に設定します。

    パターンに一致するレコードの数が98%を下回ると、分析結果の値が赤色で示されます。