设置系统指标 - 8.0

Talend Big Data Platform 入门指南

Version
8.0
Language
中文(简体)
Operating system
Big Data Platform
Product
Talend Big Data Platform
Module
Talend Administration Center
Talend Installer
Talend Runtime
Talend Studio
Content
安装和升级
数据质量和准备 > 分析数据
数据质量和准备 > 清理数据
设计和开发
Last publication date
2023-07-26
此列分析使用即用指标来提供简单的统计信息,例如电子邮件和电话列上的行、空白和重复计数。

开始之前

  • 您已在 Studio 中打开 剖析 透视图。

  • 您已创建列分析并定义到数据库的连接。

步骤

  1. 在分析编辑器的 Data Preview (数据预览) 部分,单击 Select indicators (选择指标) 打开 Indicator Selection (指标选择) 对话框。
  2. 展开 Simple Statistics (简单统计) 并选中 Row Count (行计数)Blank Count (空白计数)Duplicate Count (重复计数)。单击 OK (确定) 关闭向导。

    您要在 Email (电子邮件)Phone (电话) 列中查看行、空白和重复计数,以了解数据的一致性。

    指标将相应地添加到 Analyzed Columns (已分析列) 部分的列中。

  3. 单击 Duplicate Count (重复计数)Blank Count (空白计数) 指标旁边的 图标并将 Upper threshold (阈值上限) 字段设定为 0

    Email (电子邮件)Phone (电话) 列中定义阈值非常有用,因为这样将在分析结果中以红色写入重复计数和空白计数值。