识别数据中的异常 - 7.1

Talend MDM Platform 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend MDM Platform
task
数据治理
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend MDM Server
Talend MDM Web UI
Talend Runtime
Talend Studio

该用例说明了如何使用 studio 的 剖析 透视图分析客户电子邮件地址和电话号码。它使用列中的即用指标和模式,显示匹配和不匹配的地址数据。

然后在分析结果上生成 剖析 作业,以清理客户数据并监控其演变。

接下来,您可以使用 Data Explorer 透视图浏览不匹配的数据。

分析和清理客户数据的序列包括以下步骤:

过程

  1. 对客户电子邮件地址和电话号码创建列分析。更多详细信息,请参阅定义列分析
  2. 连接到保存分析编辑器中的客户数据的数据库。更多详细信息,请参阅创建数据库连接
  3. 添加指标以提供对数据的简单统计信息,例如行、空白和重复计数。更多详细信息,请参阅设置系统指标
  4. 添加标准模式,用于匹配电子邮件地址和电话号码。更多详细信息,请参阅设置模式
  5. 执行分析,在表和图表中显示结果。更多详细信息,请参阅显示分析结果
  6. 访问分析数据的视图,查看无效记录。更多详细信息,请参阅浏览不匹配的数据
  7. 从分析结果生成即用作业,以从电子邮件和电话列中移除重复值。更多详细信息,请参阅移除重复值
  8. 从分析结果生成即用作业,以分别从电子邮件和电话列中移除不符合标准电子邮件格式或电话号码格式的值。更多详细信息,请参阅清除不匹配值