为活动定义数据模型 - 7.1

Talend Data Stewardship 入门指南

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
数据建模 > 管理和监控
数据建模 > 管理数据模型
数据质量和准备 > 删除重复数据
数据质量和准备 > 处理任务
EnrichPlatform
Talend Data Stewardship

在此例中,您创建数据模型以确定要在 Reconciling client data 活动中管理的数据结构,通过它数据专员可以合并来自不同系统的冗余客户数据。

Talend Data Stewardship 具有数据模型感知功能,可以对数据进行语法和语义确认。因此,活动依赖数据模型来确保数据符合预期的结构和格式。

通过为此 Merging (合并) 活动定义数据结构,您可以定义数据模型中的特性并从预定义标准或语义类型中选择其类型。

开始之前

  • 管理员已在 Talend Administration Center 中创建 Talend Data Stewardship 用户并为其分配了角色。更多详细信息,请参阅创建 Data Stewardship 用户

  • 您已在 Talend Administration Center 中被分配活动所有者角色。

过程

  1. 登录 Talend Data Stewardship
  2. 选择DATA MODELS (数据模型) > ADD DATA MODEL (添加数据模型)
  3. 分别在 Name (名称)Description (描述) 字段中为新模型输入名称和描述。

    可选字段的名称旁标记有 optional (可选)

  4. Attributes (特性) 部分,定义数据模型中的列,如下所示:
    1. IDENTIFIER (标识符) 字段输入第一列的技术标识符。
    2. 根据需要在对应字段输入该列的名称和描述。
      NAME (名称) 字段中设定的内容即任务列表中显示的名称。如果未设定名称,将显示技术标识符。
    3. 从特性类型列表中选择列的类型。
      标准和语义类型默认集成在 Talend Data Stewardship
      • 对于标准类型,根据所选类型显示或隐藏其他字段。这些字段可选,可通过其定义您所定义特性的约束,如定义最小和/或最大长度或定义验证特性的模式。
      • 对于语义类型,可以使用 Talend Dictionary Service 管理语义类型。但是,此服务的可用性取决于您所拥有的许可。
  5. 单击 DEFINE LIST OF VALUES (定义值列表) 旁的开关,以显示可以设定该特性特定值的字段。
    不在此列表中的任何值均在任务列表中标记为无效。
  6. 单击 ALLOW EMPTY VALUES (允许空值) 旁的开关,禁用空字段负载为 Talend Data Stewardship (如果需要)。此选项默认启用。
  7. 单击左侧面板中的 ADD ATTRIBUTE (添加特性),重复上述步骤创建数据模型中需要的所有列。