メイン コンテンツをスキップする 補完的コンテンツへスキップ

パターンを設定

ここでは、emailカラムの内容が標準のメール形式に一致するように、postalカラムが米国の標準の郵便番号形式(ZIP)に一致するようにします。

これにより、メールとZIPコードの内容、ストラクチャー、クオリティが定義され、標準形式に一致するデータと一致しないデータの割合がわかります。

手順

  1. [Analyzed Columns] (分析済みカラム)ビューで、メールの横にあるアイコンをクリックし、[Pattern Selector] (パターン選択)ダイアログボックスを開きます。
  2. [Regex] (正規表現) > [internet] (インターネット)の順に展開し、[Email Address] (メールアドレス)チェックボックスをオンにして、[OK]をクリックしてダイアログボックスを閉じます。
  3. [Email Address] (メールアドレス)インジケーターの横にあるアイコンをクリックし、[Lower threshold (%)] (下限のしきい値(%))フィールドを98.0に設定します。

    パターンに一致するレコードの数が98%を下回ると、分析結果の値が赤色で示されます。

  4. 同じ手順を繰り返して、postalカラムにaddressフォルダーから[US Zipcode Validation] (米国の郵便番号検証)パターンを追加します。

    データ分析で使うパターンのタイプとその利用方法は、Studio Talendユーザーガイドのパターンをご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。