创建数据模型,以确定 Reconciling client data (调解客户端数据) 活动中将要管理的数据结构。此活动可帮助数据专员合并来自不同系统的冗余客户端数据。
Data Stewardship 具有数据模型感知功能,可以对数据进行语法和语义确认。因此,活动依赖数据模型来确保数据符合预期的结构和格式。
关于此任务
步骤
- 作为活动所有者登录。
- 选择Data models (数据模型) > Add data model (添加数据模型)。
- 分别在 Name (名称) 和 Description (描述) 字段中为新模型输入名称和描述。可选字段的名称旁标记有 *。
-
在 Attributes (属性) 部分,定义数据模型中的列,如下所示:
- 在 Identify (标识符) 字段输入第一列的技术标识符。
-
根据需要在对应字段输入该列的名称和描述。
Name (名称) 字段中设定的内容即任务列表中显示的名称。如果未设定名称,将显示技术标识符。
-
从属性类型列表中选择列的类型。
标准和语义类型默认集成在应用程序中。
- 对于标准类型,根据所选类型显示其他字段。这些字段可选,可通过其定义您所定义属性的约束,如定义最小和/或最大长度或定义验证属性的模式。
为确保整个值与您的验证模式相匹配,最好将验证模式用
^
和$
括起来。举例:-
[A-Z]
匹配A
和ABC
。 -
^[A-Z]$
匹配A
但不匹配ABC
。
对于
Date
和Timestamp
列,您可以访问日期和时间选择器,它能帮助您以正确的格式自动设置日期和时间。 -
- 对于语义类型,可以使用 Talend Dictionary Service 管理语义类型。但是,此服务的可用性取决于您所拥有的许可。
- 对于标准类型,根据所选类型显示其他字段。这些字段可选,可通过其定义您所定义属性的约束,如定义最小和/或最大长度或定义验证属性的模式。
-
切换 Define list of values (定义值列表) 选项,以显示可以设定该属性属性值的字段。
不在此列表中的任何值均在任务列表中标记为无效。
- 作为可选项,切换 Allow empty values (允许空值) 选项以禁止上传空字段。此选项默认启用。
-
单击 Add attribute (添加属性),重复上述步骤创建数据模型中需要的所有列。提示: 在 Rules (规则) 页签中,您可以应用数据质量规则。数据质量规则是一组业务需求,帮助您发现活动中的异常情况。规则定义了您的数据必须满足的值。您可以添加条件以使一条规则仅适用于特定的数据。有关更多信息,请参阅 Talend Data Stewardship 用户指南。