设置系统指标 - 7.1

Talend MDM Platform 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend MDM Platform
task
数据治理
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend MDM Server
Talend MDM Web UI
Talend Runtime
Talend Studio
此列分析使用即用指标来提供简单的统计信息,例如电子邮件和电话列上的行、空白和重复计数。

开始之前

过程

  1. 在分析编辑器的 Data Preview (数据预览) 部分,单击 Select indicators (选择指标) 打开 Indicator Selection (指标选择) 对话框。
  2. 展开 Simple Statistics (简单统计) 并选中 Row Count (行计数)Blank Count (空白计数)Duplicate Count (重复计数)。单击 OK (确定) 关闭向导。

    您要在 Email (电子邮件)Phone (电话) 列中查看行、空白和重复计数,以了解数据的一致性。

    指标将相应地添加到 Analyzed Columns (已分析列) 部分的列中。

  3. 单击 Duplicate Count (重复计数)Blank Count (空白计数) 指标旁边的 图标并将 Upper threshold (阈值上限) 字段设定为 0

    Email (电子邮件)Phone (电话) 列中定义阈值非常有用,因为这样将在分析结果中以红色写入重复计数和空白计数值。