设置系统指标 - 7.1

Talend Open Studio for Data Quality 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Open Studio for Data Quality
task
数据治理
数据质量和准备 > 分析数据
设计和开发
EnrichPlatform
Talend Studio
此列分析使用即用指标来提供简单的统计信息,例如电子邮件和电话列上的行、空白和重复计数。

过程

  1. 在分析编辑器的 Data Preview (数据预览) 部分,单击 Select indicators (选择指标) 打开 Indicator Selection (指标选择) 对话框。
  2. 展开 Simple Statistics (简单统计) 并选中 Row Count (行计数)Blank Count (空白计数)Duplicate Count (重复计数)。单击 OK (确定) 关闭向导。

    您要在 Email (电子邮件)Phone (电话) 列中查看行、空白和重复计数,以了解数据的一致性。

    指标将相应地添加到 Analyzed Columns (已分析列) 部分的列中。

  3. 单击 Duplicate Count (重复计数)Blank Count (空白计数) 指标旁边的 图标并将 Upper threshold (阈值上限) 字段设定为 0

    Email (电子邮件)Phone (电话) 列中定义阈值非常有用,因为这样将在分析结果中以红色写入重复计数和空白计数值。