このアーキテクチャー図はTalend Cloud Data Preparationのファンクションブロックを示したものです。
この図は、ローカルネットワークとクラウドインフラストラクチャーという2つの主要な部分に分かれています。
ローカルネットワーク
ローカルネットワークには、Webブラウザー、Talend Studio、Remote Engine Gen 1、Remote Engine Gen2が含まれています。
WebブラウザーからTalend Cloud Data Preparationアプリケーションにアクセスします。
Talend Studioからは、tDatasetInput、tDatasetOutput、tDataprepRunの各コンポーネントを使うことでTalend Cloud Data Preparationのファンクションを活用できます。さまざまなデータセットからデータセットを作成してTalend Cloud Data Preparationにエクスポートしたり、データインテグレーションジョブまたはSparkジョブでプレパレーションを直接利用したりできます。
Remote Engine Gen 1は、Data Preparationコンポーネントを使うジョブの実行、およびオンプレミスでのアーティファクトやタスクの実行に使用されます。
Remote Engine Gen2は、Talend Cloudアプリケーションのオブジェクトを実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。
クラウドインフラストラクチャー
クラウドインフラストラクチャーには、データセットサービスに依存するTalend Cloud Data Preparationの他にCloud Engine for Designが含まれています。
- データセットサービスは、Talend Cloud Data Preparation、Talend Cloud Data Inventory、Talend Cloud Pipeline Designer用に統合されたデータセットリストを提供します。
- Talend Cloud Management Consoleでは、ロール、ユーザー、プロジェクト、ライセンスを管理します。クラウドアプリケーションの新しいユーザーを作成し、カスタムグループに割り当てます。その後、ロールを決定してユーザーに割り当てます。Talend Cloud Management Consoleは、ライセンスファイルをインポートし、Talend Studioで共同作業するプロジェクトを作成するためも使用されます。加えて、Webユーザーのデータおよびファイル転送、データインテグレーション、および共有データソースへのアクセスを有効にできます。たとえば、アプリケーション間のデータ交換と同期を自動化する、設定済みのサンプルタスクまたはデザインタスクをインポートして使用できます。
- Talend Cloud Data Preparationでは、ローカルファイルやその他のソースからデータをインポートし、新しいプレパレーションを作成することでクレンジングしたりエンリッチ化したりできます。
- Talend Dictionary Serviceでは、Talend Cloud Data Preparationで開いた場合に、データの各カラムに適用されるセマンティックカテゴリーを追加、削除、変更できます。
Cloud Engine for Designは、アーティファクト、タスク、プレパレーションをクラウドで実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。