安装后配置 Talend Data Preparation - 7.2

Talend Data Integration 安装指南,适用于:Linux

EnrichVersion
7.2
EnrichProdName
Talend Data Integration
EnrichPlatform
Talend Activity Monitoring Console
Talend Administration Center
Talend Artifact Repository
Talend CommandLine
Talend Data Preparation
Talend Data Stewardship
Talend Identity and Access Management
Talend Installer
Talend JobServer
Talend Log Server
Talend Runtime
Talend Studio
task
数据治理

过程

  1. 打开 <Data_Preparation_Path>/config/application.properties 文件并编辑以下 Talend Data Preparation 属性:
    字段 操作
    public.ip 输入您访问 Talend Data Preparation 时要使用的主机名。
    server.port 输入您想要用于 Talend Data Preparation 用户界面的端口。
    iam.ip 输入 Talend Identity and Access Management 实例的 URL。
    security.oauth2.client.clientId 输入 Talend Identity and Access Management OIDC 客户端标识符。
    security.oauth2.client.clientSecret 输入 Talend Identity and Access Management OIDC 客户端密码。
    iam.scim.url 确保 Talend Identity and Access Management 端口是正确的。
    app.products[0].id=TDS

    app.products[0].name=Data Stewardship

    app.products[0].url=<place_your_tds_url_here>

    输入 Talend Data Stewardship 实例的 URL。

    在属性文件中输入的所有密码在您启动 Talend Data Preparation 实例时加密。

  2. 将以下字段更新为您的 MongoDB 设置:
    字段 描述
    mongodb.host MongoDB 实例的主机名
    mongodb.port MongoDB 实例的端口号
    mongodb.database Talend Data Preparation 连接的数据库的名称,默认为 dataprep。该数据库在第一次启动 Talend Data Preparation 时创建。
    mongodb.user 用于连接到该数据库的用户名。
    mongodb.password 用于连接到该数据库的密码。
  3. 要启用 Talend Data PreparationComponents Catalog 服务之间的交互,请使用您的 Components Catalog 服务器主机和端口编辑以下行:
    tcomp.server.url=http://<tcomp_host>:<tcomp_port>/tcomp
  4. 要在安装 Talend Data PreparationTalend Data Stewardship 之后启用应用切换器,请取消注释以下行并添加您的 Talend Data Stewardship 实例的 URL:
    app.products[0].id=TDS
    app.products[0].name=Data Stewardship
    app.products[0].url=<place_your_tds_url_here>

    还必须将您的 Talend Data Preparation 实例的 URL 添加到 Talend Data Stewardship 的配置文件。有关更多信息,请参阅有关在安装后如何配置 Talend Data Stewardship 的部分。

  5. 默认会启用审计日志。您必须在 audit.properties 文件中指定正确的 appender.http.url 参数,或禁用审计日志。更多详细信息,请参阅启用和配置 Talend Data Preparation 中的审计功能
  6. 为支持将 Streams RunnerTalend Data Preparation 一起使用,请将 streams.enable 属性设置为 true
  7. 要配置对 Streams Runner 的访问,请编辑以下字段:
    字段 描述
    streams.flow.runner.url 输入 Streams Runner 的 URL。该 URL 具有以下语法:http://<local_machine_IP>:<Big_data_preparation_port>/
    streams.kerberos.principal 输入您的 Kerberos 主体。
    streams.kerberos.keytab_path 输入您的 Kerberos keytab 文件的路径。
    streams.hdfs.server.url 您可以选择设置一个默认 URL,当在 Talend Data Preparation 中使用 HDFS 数据集时,将显示在输入和输出 Path (路径) 字段中。
    <Data_Preparation_Path>/config/tuning.properties 文件包含用于更高级调优的附加参数。确保此文件中的参数与您的集群大小匹配。
  8. 要启用语义类型,请编辑以下行:dataquality.semantic.list.enable=truedataquality.server.url=http://<local machine ip>:8187/
  9. 执行 start.sh 文件以启动 Talend Data Preparation 实例。