このステップには、Talend Data Preparationをマシンに手動でインストールするステップが含まれています。
始める前に
- Talend Administration Centerがインストールされ、実行されている。
- Talend Identity and Access Managementがインストールされ、実行されている。
- Talend Data PreparationユーザーがTalend Administration Centerに存在します。詳細は、Talend Administration Centerユーザーガイドをご覧ください。
- マシンにインストールされるMongoDBの他のインスタンスがないこと。
- Talend Data Preparation with Big Dataを使用する場合、サポートされているHadoopディストリビューションのいずれかを使用します。詳細は、Talend Data Preparation with Big DataでサポートされているHadoopディストリビューションのバージョンをご覧ください。
- Talend Data Preparationをインストールする前に、ハードウェアとソフトウェアの要件を満たしていることをご確認ください。詳細は、オンプレミスのインストール要件をご覧ください。
手順
-
MongoDBインスタンスをhttps://www.mongodb.com/download-centerからダウンロードしてインストールします。
-
Talend-DataPreparation-Server-VA.B.C.zipファイルをTalend Data Preparationのインストール先に展開します。
-
<Data_Preparation_Path>/services/components-api-service-rest-all-components-VA.B.C.zipをComponents Catalogをインストールする場所に展開します。
-
Talend Data Preparationをビッグデータのコンテキストで使用するには、2つの追加ツール、Streams RunnerとSpark Job Serverをインストールする必要があります。
Streams RunnerとSpark Job ServerはLinuxマシンにインストールする必要があります。
-
<Data_Preparation_Path>/services/data-streams-streamsrunner-svc-A.B.C.tgzをStreams Runnerインストールする場所に展開します。
-
<Data_Preparation_Path>/services/spark-jobserver-A.B.C.tar.gzをSpark Job Serverインストールする場所に展開します。このファイルには、Spark Job Serverに加えて、必要なすべての依存項目が含まれています。
さらに、curl(コマンドラインツールで、データをURLを使用して転送するためのライブラリー)が既にインストール済みであることが必要です。必要に応じて
https://curl.haxx.se/からダウンロードできます。
-
mongo
をPATH
環境変数に追加します。
-
use dataprep
コマンドを使って、MongoDBにdataprep
データベースを作成します。
-
MongoDBの
dataprep
データベースで次のユーザーを作成します:
- ユーザー名:
dataprep_user
- パスワード:
duser
これを行うには、次のコマンドを使用します。
db.createUser( { user: "dataprep-user", pwd: "duser", roles: [{ role: "readWrite", db: "dataprep"}]})
<Data_Preparation_Path>/create_mongo_user.shファイルを実行することにより、ユーザーとパスワードを自動で作成できます。