パターンを設定 - 7.3

Talend Real-Time Big Data Platform 入門ガイド

Version
7.3
Language
日本語
Operating system
Real-Time Big Data Platform
Product
Talend Real-Time Big Data Platform
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
Last publication date
2023-07-24
このカラム分析では、事前定義されたパターンを使用して、メールおよび電話番号のカラムの内容をそれぞれ、標準のメールおよび米国の電話番号パターンと照合します。これにより、メールと電話番号の内容、ストラクチャー、品質が定義され、標準形式に一致するデータと一致しないデータの割合がわかります。

始める前に

  • Studioで Profiling パースペクティブを開いていること。

  • カラム分析が作成済みで、データベースへの接続が定義済みであること。

手順

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで、Emailカラムの横にあるアイコンをクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  2. [Regex] (正規表現) > [internet] (インターネット)の順に展開し、[Email Address] (メールアドレス)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析済みカラム)セクションのカラムに追加されます。

  3. Phoneカラムの横にあるアイコンをクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  4. [Regex] (正規表現) > [phone] (電話)の順に展開し、[US phone numbers] (米国の電話番号)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。

    パターンが[Analyzed Columns] (分析済みカラム)セクションのカラムに追加されます。

  5. [Email Address] (メールアドレス)[US phone numbers] (米国の電話番号)パターンの横にあるアイコンをクリックし、[Lower threshold (%)] (下限しきい値(%))フィールドを98.0に設定します。

    パターンに一致するレコードの数が98%を下回ると、分析結果の値が赤色で示されます。