设定主记录规则和值 - 8.0

Talend Data Stewardship 入门指南

Version
8.0
Language
中文(简体)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Content
数据建模 > 管理和监控
数据建模 > 管理数据模型
数据质量和准备 > 删除重复数据
数据质量和准备 > 处理任务
当客户端副本记录来自不同的源,Talend Data Stewardship 首先根据在活动中定义的存活规则,决定要使用匹配记录的哪些属性来创建主记录。

关于此任务

数据专员审查其任务并手动修改每个记录属性的存活规则,或输入全新的值以获得最准确可靠的主记录。

步骤

  1. 以数据专员的身份登录。
  2. Tasks (任务) 页面中,单击此示例中的活动名称 Reconciling client data (调解客户端数据),打开分配给您的任务列表。
    列表顶部的质量条使用颜色向您提供每个列中数据质量的清晰视图。指向颜色可获得选定列中数据值的详情。
  3. 单击质量条上的颜色以筛选要使用的数据,并列出匹配颜色指示的任务:
    选项 描述
    绿色 表示与列类型匹配的有效数据。
    灰色 表示空字段。但是,强制字段的空值以红色标记,而非白色。
    红色 表示与列类型或数据模型中参数设置不匹配的无效数据。
  4. 单击任务列表左上角的向下箭头展开所有任务,或单击特定任务的向下箭头将其展开。
  5. 设定存活规则,从客户记录中选择属性并用其构建主记录。有几种可行的方法:
    • 为多个记录的一个属性手动设定存活规则。

      1. 单击列标题,如 Last_Name,在右侧面板中浏览到 Survivorship (存活) 部分。
      2. 展开 Survivorship rule (存活规则) 列表并选择 Most common (最常见) 作为要应用到该列表中所有任务的名称属性的存活规则。
      3. 如果想要将该规则应用于包括空值在内的所有名称值,则清除 Avoid null values (避免 null 值) 复选框,否则将其保留选中状态。
      4. 单击 Submit (提交) 选择最常用的名称值,并将其添加到所有任务的主记录中。
    • 为一个或多个黄金记录的所有属性手动设置存活规则。

      1. 选择要为其设置该规则的任务,然后在右侧面板中的 Task (任务) 下面,单击 Apply survivorship rule (应用存活规则)
      2. Selection (选择) 列表中,单击 Selected tasks (选定的任务)

        可以将该规则应用于所有任务,或者如果已在列表上定义了筛选器,则可仅应用于筛选的任务。

      3. Rule (规则) 列表中,选择将 Most trusted (最可信) 应用于该组选定的任务。

        如果您已在 Merging (合并) 活动中定义了重复数据的源,则源名称已包括在列表中,并且可选择它作为存活规则以应用于列值。

      4. 如果想要将该规则应用于包括空值在内的所有值,则清除 Avoid null values (避免 null 值) 复选框,否则将其保留选中状态。
      5. 单击 Submit (提交) 以将具有最高分数的名称值添加到选定的黄金记录。
    • 为记录的一个或多个属性手动设定存活规则:指向任务主记录中的属性,并从显示的图标中选择要应用的存活规则。

      • :从重复项中选择第一个有效属性值。“第一个”由创建任务时记录的顺序定义。

      • :从重复项中选择第一个最常见的属性值。

      • :从重复项中选择最新的属性值。

      • :从重复项中选择最可信的属性值。

        存活规则不适用于选定的记录时,存活图标将灰显。

    • 选择给定的源属性的值,作为主记录的值:指向一个源属性,然后单击向上箭头,在主记录中设置所选的值。
  6. 或者,双击主记录中的值,并设定您选择的未在任何源中出现的值。
  7. 单击您修改的数据记录旁边的 图标,将任务标记为可以确认。
    第一个字段标记为绿色背景,计算任务完成百分比,并在右上角显示该百分比。

    您可以重新修改准备好确认的记录,但这会将任务恢复到其初始状态,背景为深灰色。您需要重新单击锁图标,将任务标记为可以确认。

  8. 如果锁图标为红色背景,先更正任务中的无效值,然后才能将其标记为可以确认。
  9. 重复上述步骤,为分配给您的所有任务创建主记录。
  10. 单击右上角的 Validate(验证) 批准更改并从列表中移动任务。

结果

创建主记录,并将已确认的记录移动到本示例中被授予 Account validator 角色的活动参与者列表中。