为活动定义数据模型 - 7.3

Talend Data Stewardship 入门指南

Version
7.3
Language
中文(简体)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Content
数据建模 > 管理和监控
数据建模 > 管理数据模型
数据质量和准备 > 删除重复数据
数据质量和准备 > 处理任务
Last publication date
2023-01-09

创建数据模型,以确定 Reconciling client data (调解客户端数据) 活动中将要管理的数据结构。此活动可帮助数据专员合并来自不同系统的冗余客户端数据。

Data Stewardship 具有数据模型感知功能,可以对数据进行语法和语义确认。因此,活动依赖数据模型来确保数据符合预期的结构和格式。

关于此任务

定义数据模型中的属性并从预定义标准或语义类型中选择其类型

步骤

  1. 作为活动所有者登录。
  2. 选择DATA MODELS (数据模型) > ADD DATA MODEL (添加数据模型)
  3. 分别在 Name (名称)Description (描述) 字段中为新模型输入名称和描述。可选字段的名称旁标记有 *
  4. Attributes (特性) 部分,定义数据模型中的列,如下所示:
    1. IDENTIFIER (标识符) 字段输入第一列的技术标识符。
    2. 根据需要在对应字段输入该列的名称和描述。
      NAME (名称) 字段中设定的内容即任务列表中显示的名称。如果未设定名称,将显示技术标识符。
    3. 从属性类型列表中选择列的类型。

      标准和语义类型默认集成在应用程序中。

      • 对于标准类型,根据所选类型显示其他字段。这些字段可选,可通过其定义您所定义属性的约束,如定义最小和/或最大长度或定义验证属性的模式。

        为确保整个值与您的验证模式相匹配,最好将验证模式用 ^$ 括起来。

        举例:
        • [A-Z] 匹配 AABC
        • ^[A-Z]$ 匹配 A 但不匹配 ABC

        对于 DateTimestamp 列,您可以访问日期和时间选择器,它能帮助您以正确的格式自动设置日期和时间。

      • 对于语义类型,可以使用 Talend Dictionary Service 管理语义类型。但是,此服务的可用性取决于您所拥有的许可。
  5. 切换 DEFINE LIST OF VALUES (定义值列表) 选项,以显示可以设定该特性特定值的字段。
    不在此列表中的任何值均在任务列表中标记为无效。
  6. 作为可选项,切换 ALLOW EMPTY VALUES (允许空值) 选项以禁止上传空字段。此选项默认启用。
  7. 单击 ADD ATTRIBUTE (添加特性),重复上述步骤创建数据模型中需要的所有列。