设定模式 - 7.1

Talend Open Studio for Data Quality 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Open Studio for Data Quality
task
Qualité et préparation de données > 分析数据
数据治理
设计和开发
EnrichPlatform
Talend Studio
此列分析使用预定义模式将电子邮件和电话列的内容分别与标准电子邮件和美国电话模式相匹配。这将定义电子邮件和电话号码的内容、结构和质量,并提供与标准格式匹配和不匹配的数据的百分比。

过程

  1. 在分析编辑器的 Data Preview (数据预览) 部分,单击 Email 列旁边的 图标打开 Pattern Selector (模式选择器] 对话框。
  2. 展开Regex (正则表达式) > internet (互联网),选中 Email Address (电子邮件地址) 复选框后单击 OK (确定) 关闭对话框。

    模式将添加到 Analyzed Columns (已分析列) 部分的列中。

  3. 单击 Phone 列旁边的 图标打开 Pattern Selector (模式选择器) 对话框。
  4. 展开 Regex (正则表达式) > phone (电话),选中 US phone numbers (美国电话号码) 复选框后单击 OK (确定) 关闭对话框。

    模式将添加到 Analyzed Columns (已分析列) 部分的列中。

  5. 单击 Email Address (电子邮件地址)US phone numbers (美国电话号码) 模式旁边的 图标并在 Lower threshold (%) (阈值下限百分比) 字段中设定 98.0

    如果与模式匹配的记录数少于 98%,其将在分析结果中以红色写入。