设置模式 - 7.3

Talend Big Data Platform 入门指南

Version
7.3
Language
中文(简体)
Operating system
Big Data Platform
Product
Talend Big Data Platform
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
安装和升级
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
Last publication date
2023-08-02
此列分析使用预定义模式将电子邮件和电话列的内容分别与标准电子邮件和美国电话模式相匹配。这将定义电子邮件和电话号码的内容、结构和质量,并提供与标准格式匹配和不匹配的数据的百分比。

开始之前

  • 您已在 Studio 中打开 剖析 透视图。

  • 您已创建列分析并定义到数据库的连接。

步骤

  1. 在分析编辑器的 Data Preview (数据预览) 部分,单击 Email 列旁边的 图标打开 Pattern Selector (模式选择器] 对话框。
  2. 展开 Regex (正则表达式) > internet (互联网),选中 Email Address (电子邮件地址) 复选框后,单击 OK (确定) 关闭对话框。

    模式将添加到 Analyzed Columns (已分析列) 部分的列中。

  3. 单击 Phone 列旁边的 图标打开 Pattern Selector (模式选择器) 对话框。
  4. 展开 Regex (正则表达式) > phone (电话),选中 US phone numbers (美国电话号码) 复选框后单击 OK (确定) 关闭对话框。

    模式将添加到 Analyzed Columns (已分析列) 部分的列中。

  5. 单击 Email Address (电子邮件地址)US phone numbers (美国电话号码) 模式旁边的 图标并在 Lower threshold (%) (阈值下限百分比) 字段中设置 98.0

    如果与模式匹配的记录数少于 98%,其将在分析结果中以红色写入。