使用质量条 - 7.3

Talend Data Preparation 入门指南

author
Talend Documentation Team
EnrichVersion
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
数据质量和准备 > 清理数据
EnrichPlatform
Talend Data Preparation

识别错误数据最快速的方法是查看质量条。

在每列下方有一个质量条,显示含正确数据、错误数据或空字段的字段数量。每个列表由一种颜色表示:

  • 绿色表示匹配单元格格式的数据
  • 白色表示空单元格
  • 橙色表示不匹配单元格格式的数据

单击任意颜色可选中、删除或清除含无效格式数据的单元格。鼠标停放在颜色上可显示每个类别的确切行数,以及在列中所占百分比。

通过查看 Email (电子邮件) 列标头下的质量条,您可以看到有空单元格和数据中的错误值。您将移除这些内容。

要使用质量条移除含错误单元格的行,请按如下步骤继续:

过程

  1. 单击 Email (电子邮件) 列标头中质量条的白色部分。

    将打开质量菜单。

  2. 单击 Delete the rows with empty cell (删除有空单元格的行)

    Email (电子邮件) 列的空单元格已被删除,仅保留橙色条表示的无效值。

  3. 重复最后两个步骤,但这次单击质量条的橙色部分,并选择 Delete the rows with invalid cell (删除有无效单元格的行)

    Email (电子邮件) 列现在已清除所有无效数据或空单元格。

  4. 使用质量条移除 Zip (邮编)Phone (电话) 列的无效单元格。

结果

现在,含无效数据的唯一剩余列是 State (州),但您将以不同的方式进行处理。