识别数据中的异常 - 7.3

Talend Real-Time Big Data Platform 入门指南

Version
7.3
Language
中文(简体)
Operating system
Real-Time Big Data Platform
Product
Talend Real-Time Big Data Platform
Module
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
Content
安装和升级
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
Last publication date
2023-08-02

该用例说明了如何使用 studio 的 剖析 透视图分析客户电子邮件地址和电话号码。它使用列中的即用指标和模式,显示匹配和不匹配的地址数据。

然后在分析结果上生成 剖析 作业,以清理客户数据并监控其演变。

接下来,您可以使用 Data Explorer 透视图浏览不匹配的数据。

分析和清理客户数据的序列包括以下步骤:

步骤

  1. 对客户电子邮件地址和电话号码创建列分析。
  2. 连接到保存分析编辑器中的客户数据的数据库。
  3. 添加指标以提供对数据的简单统计信息,例如行、空白和重复计数。
  4. 添加标准模式,用于匹配电子邮件地址和电话号码。
  5. 执行分析,在表和图表中显示结果。
  6. 访问分析数据的视图,查看无效记录。
  7. 从分析结果生成即用作业,以从电子邮件和电话列中移除重复值。
  8. 从分析结果生成即用作业,以分别从电子邮件和电话列中移除不符合标准电子邮件格式或电话号码格式的值。