R2021-05 新增功能 - 7.3

Talend Data Fabric 发布说明

Version
7.3
Language
中文(简体)
Product
Talend Data Fabric
Content
数据治理
版本说明

Big Data:新功能

功能

描述

通过 Spark 3.0 支持 AWS EMR 6.2.x(技术预览)

现在可以在 AWS EMR 6.2.x 上通过 Spark 3.0 运行 Spark Batch、Spark Streaming 和标准作业。
重要: 由于只是技术预览,因此不适合生产环境。
注: 此功能存在与以下组件相关的已知问题:
  • HBase(用于 Spark Batch 和 Spark Streaming 作业)
  • Hive(用于标准、Spark Batch 和 Spark Streaming 作业)
  • Sqoop(用于标准作业)

CDP Public Cloud Data Hub 在 Azure 上获得支持(技术预览)

您现在可以在 Cloudera Management Console 的 Azure 上配置 CDP Public Cloud Data Hub 实例,以便在 Talend Studio 中的远程 JobServer 上运行作业。
重要: 由于只是技术预览,因此不适合生产环境。

Data Integration:新功能

功能

描述

Git 分支列表增强功能
  • 上次选择的分支(如有)现在在 Studio 登录窗口的分支字段中显示为默认分支。
  • 打开有十个以上分支和标签的项时,Studio 登录窗口的 Branch(分支)下拉菜单中新增了 > Click for more remote branches...(> 单击查看更多远程分支...) 项。这样您可以在对话框中搜索和选择远程分支或标签。
  • 改进了 Studio 登录窗口的 Branch(分支)下拉菜单、Studio Repository(存储库)树视图下拉菜单和 Remote branches(远程分支)对话框中的分支和标签顺序。
Docker 支持改进 现在将作业发布为 Docker 镜像时,Talend Studio支持所有 Docker registry(Docker 注册表),例如 JFrog Artifactory Docker registry(JFrog Artifactory Docker 注册表)
Outline(大纲)视图的增强功能 Talend StudioOutline(大纲)视图的工具栏上增加了一个按钮。在 Outline(大纲)视图中选择一个树视图节点,然后单击按钮可以浏览到设计工作区上的实际相关项。
Allow specific characters (UTF8,...) for columns of schemas(允许表结构的列使用特殊字符 (UTF8,...))选项移动 Allow specific characters (UTF8,...) for columns of schemas(允许表结构的列使用特殊字符 (UTF8,...))选项已从 Preference(首选项) 对话框的 Talend > Specific Settings(特定设置) 视图移到 Project Settings(项目设置)对话框中的 General(常规)视图。
注: 在安装 R2021-05 Studio 每月更新或 Talend 提供的更新后,默认禁用此选项(即使之前已启用)。
支持 Sonatype Nexus 3.30 现在支持 Sonatype Nexus 3.30。

SCP 组件:新的键算法

SCP 组件现在支持新的键算法。单击 here(此处) 获取支持的键算法的完整列表。

SAP 传输包已更新

SAP 传输包 TEDK910156.zip 现已取代 TEDK910105.zip

tSalesforceBulkExec:支持新的文件格式

tSalesforceBulkExec 支持 JSON 文件格式。现在可以从 JSON 文件加载数据。

tS3List: 提供了新的全局变量

tS3List 提供以下新的全局变量:

  • CURRENT_SIZE
  • CURRENT_LASTMODIFIED
  • CURRENT_OWNER
  • CURRENT_OWNER_ID
  • CURRENT_ETAG
  • CURRENT_STORAGECLASS

tS3Copy 和 tS3Put:多部分阈值可定制

可以指定 tS3Copy 和 tS3Put 的多部分阈值。

tS3Connection:选项可以是动态的

可以在 Dynamic settings(动态设置)视图中添加三个 tS3Connection 选项作为动态设置。然后可以使用上下文变量设置这些选项。

tSnowflakeOutput:提供了 Die on error(因错误终止)选项

tSnowflakeOutput 组件提供了 Die on error(因错误终止)选项,使您可以在发生错误时选择是否结束作业。

tJDBCRow:错误检测选项

tJDBCRow 组件提供了 Detect error on multiple statements(检测多个语句中的错误)选项,选中该选项,则会在检测到由 SQL 查询语句引起的错误时停止作业执行。

tFileFetch:参数编码选项

tFileFetch 组件现在提供 Encoding for parameters(参数编码)选项,可以为 POST 方法参数指定字符编码。

有新组件可用:tNeo4jv4Row

此版本提供了 tNeo4jv4Row,可在单个事务中对 Neo4J 版本 4 数据库执行多个 Cypher 查询语句。

管理 NoSQL 元数据时支持 MongoDB 4.4 API

现在可以使用 Mongo DB 4.4 版本创建到 MongoDB 数据库的连接。

Data Quality:新功能

功能

描述

冗余分析增强功能 在冗余分析的 Analyzed Column Sets(分析列集) 区域中添加了 Ignore Null(忽略 Null)复选框。
tRuleSurvivorship 增强功能 tRuleSurvivorship 组件的 Advanced settings(高级设置)视图中增加了 t-Swoosh 复选框。