手动安装 Talend Data Preparation

此过程包含在计算机上手动安装 Talend Data Preparation 的步骤。

开始之前

Talend Administration Center 已安装并运行。
Talend Identity and Access Management 已安装并运行。
一个 Talend Data Preparation 用户已在 Talend Administration Center 中存在。有关更多信息，请参阅《Talend Administration Center 用户指南》。
您的计算机上没有安装其他 MongoDB 实例。
要将 Talend Data Preparation 与 Big Data 一起使用，请使用某个受支持的 Hadoop 发行版。有关更多信息，请参阅带 Big Data 的 Talend Data Preparation 支持的 Hadoop 发行版（仅提供英文版本）。
在安装 Talend Data Preparation 之前，确保您满足硬件和软件要求。有关更多信息，请参阅本地部署产品安装前提（仅提供英文版本）。

步骤

从 https://www.mongodb.com/download-center （仅提供英文版本）下载 MongoDB 实例并安装它。
有关受支持的 MongoDB 数据库的更多信息，请参阅兼容的数据库（仅提供英文版本）。

有关如何安装它的更多信息，请参阅 MongoDB 文档（仅提供英文版本）。

如果您想要使用 SSL 保护与 MongoDB 的连接，必须在您的计算机上手动安装 MongoDB Enterprise Server。有关更多信息，请参阅 https://docs.mongodb.com/v4.0/security/ （仅提供英文版本）。
将 Talend-DataPreparation-Server-VA.B.C.zip 文件解压到想要安装 Talend Data Preparation 的位置。
将 <Data_Preparation_Path>/services/components-api-service-rest-all-components-VA.B.C.zip 文件解压到想要安装 Components Catalog 的位置。
要在 Big Data 环境中使用 Talend Data Preparation，您需要安装两个附加工具，Streams Runner 和 Spark Job Server。
请注意，Streams Runner 和 Spark Job Server 必须安装在 Linux 计算机上。
1. 将 <Data_Preparation_Path>/services/data-streams-streamsrunner-svc-A.B.C.tgz 文件解压到想要安装 Streams Runner 的位置。
2. 将 <Data_Preparation_Path>/services/spark-jobserver-A.B.C.tar.gz 文件解压到想要安装 Spark Job Server 的位置。此文件包含 Spark Job Server 以及所有必需的依赖关系。
  此外，您必须已经安装 curl，这是一个通过 URL 来传输数据的命令行工具和库。如果需要，您可以从 https://curl.haxx.se/ （仅提供英文版本）下载它。
将 mongo 添加到 PATH 环境变量。
使用以下命令在 MongoDB 中创建 dataprep 数据库：use dataprep。
在 MongoDB 中为 dataprep 数据库创建以下用户：
- 用户名：dataprep-user
- 密码：duser
为此，您可以使用以下命令：
```
db.createUser( { user: "dataprep-user", pwd: "duser", roles: [{ role: "readWrite", db: "dataprep"}]})
```
可以通过执行 <Data_Preparation_Path>/create_mongo_user.sh 文件来自动创建用户名和密码。

本页面有帮助吗？

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进！

在此处留下您的反馈