Talend Cloud Data Preparationのアーキテクチャー - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

下のアーキテクチャー図はTalend Cloud Data Preparationの機能ブロックを示したものです。

この図は、ローカルネットワークとクラウドインフラストラクチャーという2つの主要な部分に分かれています。

ローカルネットワーク

ローカルネットワークには、Webブラウザー、Talend StudioRemote Engine Gen2が含まれています。

WebブラウザーからTalend Cloud Data Preparationアプリケーションにアクセスします。

Talend Studioからは次の操作が可能です。
  • データ統合ジョブをタスクとしてTalend Cloud Management Consoleにパブリッシュし、Webユーザーが利用できるようにして、クラウドで実行します。
  • tDatasetInput、tDatasetOutput、tDataprepRunの各コンポーネントを使って、Talend Cloud Data Preparationの機能を利用します。それによってさまざまなデータセットからデータセットを作成してTalend Cloud Data Preparationにエクスポートしたり、データ統合ジョブまたはSparkジョブでプレパレーションを直接利用したりできるようになります。

Remote Engine Gen2は、他のTalend Cloudアプリケーションのプレパレーションやオブジェクトをオンプレミスで実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。

クラウドインフラストラクチャー

クラウドインフラストラクチャーには、データセットサービスに依存するTalend Cloud Data Preparationの他にCloud Engine for Designが含まれています。
  • データセットサービスでは、Talend Cloud Data Preparation、Talend Cloud Data Inventory、Talend Cloud Pipeline Designer向けの統一データセットリストを利用できます。
  • Talend Cloud Management Consoleでは、ロール、ユーザー、プロジェクト、ライセンスを管理できます。クラウドアプリケーションの新しいユーザーを作成し、カスタムグループに割り当てることができます。その後、ロールを決定し、ユーザーに割り当てることができます。Talend Cloud Management Consoleは、ライセンスファイルをインポートし、Studioで共同作業するプロジェクトを作成するためにも使用されます。加えて、Webユーザーのデータおよびファイル転送、データ統合、共有データソースへのアクセスを有効にできます。たとえば、アプリケーション間のデータ交換と同期を自動化する、設定済みのサンプルタスクまたはデザインタスクをインポートして使用できます。
  • Talend Cloud Data Preparationでは、ローカルファイルやその他のソースからデータをインポートし、新しいプレパレーションを作成することでクレンジングしたりエンリッチ化したりできます。
  • Talend Dictionaryサービスでは、Talend Cloud Data Preparationで開いた場合に、データの各カラムに適用されるセマンティックカテゴリーを追加、削除、変更できます。

Cloud Engine for Designは、アーティファクト、タスク、プレパレーションをクラウドで実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。