Data Preparation:新功能 - 7.2

Talend Master Data Management 产品发布说明

EnrichVersion
7.2
EnrichProdName
Talend MDM Platform
task
数据治理
功能 描述
智能填充 此新功能使您可以基于少量示例定义模式,并通过机器学习算法将转换应用于整个列。智能填充为您提供了许多格式化可能性,适用于任何数据类型。
提取名称的一部分 现在,通过利用机器学习模型,可以将全名拆分为各个子部分,例如职位、名字、中间名、姓氏和后缀,从而提高数据集清理和标准化的效率。
根据语义定义提取字段的各部分 现在,利用语义类型的定义,可以将单个单元格中包含的各类信息提取到单个列中,从而提高数据集清理和标准化的效率。
可重复屏蔽和复合语义类型屏蔽 数据屏蔽已得到改进,现在可以处理种子,以提供可重复的屏蔽。这意味着相同的源值将始终作为相同的屏蔽值输出。

此外,现在可以对复合语义类型执行语义屏蔽,从而增强数据隐私。

自动完成 增添“自动完成”功能后,从语义类型基于字典的列中编辑单元格比过去更容易。从建议值列表中进行选择,以确保您的数据遵循语义类型的标准。
重复数据删除 除了可以应用于整个表的现有重复数据删除函数之外,您现在可以基于一个或多个列的值应用重复数据删除操作,从而更好地操控要删除的行。