手动安装 Talend Data Preparation - 7.1

Talend Data Fabric 安装与升级指南 (Linux)

EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
数据治理
EnrichPlatform
Talend Activity Monitoring Console
Talend Administration Center
Talend Artifact Repository
Talend CommandLine
Talend Data Preparation
Talend Data Stewardship
Talend DQ Portal
Talend ESB
Talend Identity and Access Management
Talend Installer
Talend JobServer
Talend Log Server
Talend MDM Server
Talend MDM Web UI
Talend Repository Manager
Talend Runtime
Talend SAP RFC Server
Talend Studio
此过程包含在计算机上手动安装 Talend Data Preparation 的步骤。有关使用 Talend Installer 的自动安装过程,请参阅使用 Talend Installer 图形安装模式

开始之前

过程

  1. https://www.mongodb.com/download-center 下载 MongoDB 3.4 实例并安装。
    有关受支持的 MongoDB 数据库的更多信息,请参阅兼容的数据库
    有关如何安装它的更多信息,请参阅 MongoDB 文档
    如果您想要使用 SSL 保护与 MongoDB 的连接,必须在您的计算机上手动安装 MongoDB Enterprise Server。有关更多信息,请参阅 https://docs.mongodb.com/v3.4/security/
  2. Talend-DataPreparation-Server-VA.B.C.zip 文件解压到想要安装 Talend Data Preparation 的位置。
  3. <Data_Preparation_Path>/services/components-api-service-rest-all-components-VA.B.C.zip 文件解压到想要安装 Components Catalog 的位置。
  4. 要在 Big Data 环境中使用 Talend Data Preparation,您需要安装两个附加工具,Streams RunnerSpark Job Server
    请注意,Streams RunnerSpark Job Server 必须安装在 Linux 计算机上。
    1. <Data_Preparation_Path>/services/data-streams-streamsrunner-svc-A.B.C.tgz 文件解压到想要安装 Streams Runner 的位置。
    2. <Data_Preparation_Path>/services/spark-jobserver-A.B.C.tar.gz 文件解压到想要安装 Spark Job Server 的位置。此文件包含 Spark Job Server 以及所有必需的依赖关系。
      此外,您必须已经安装 curl,这是一个通过 URL 来传输数据的命令行工具和库。如果需要,您可以从 https://curl.haxx.se/ 下载它。
  5. mongo 添加到 PATH 环境变量。
  6. 使用以下命令在 MongoDB 中创建 dataprep 数据库:
    use dataprep
  7. 在 MongoDB 中为 dataprep 数据库创建以下用户:
    • 用户名:dataprep-user
    • 密码:duser
    为此,您可以使用以下命令:
    db.createUser( { user: "dataprep-user", pwd: "duser", roles: [{ role: "readWrite", db: "dataprep"}]})
    可以通过执行 <Data_Preparation_Path>/create_mongo_user.sh 文件来自动创建用户名和密码。