Talend Cloud Data Preparationのアーキテクチャー(ベータ版) - Cloud

Talend Cloud Data Preparationユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
Last publication date
2024-02-21

このアーキテクチャー図はTalend Cloud Data Preparationのファンクションブロックを示したものです。
Talend Cloud Data Preparationのファンクションブロックを示した図。

この図は、主要な部分である2つの環境、つまりローカルネットワークとクラウドインフラストラクチャーという2つの主要な部分に分かれています。

ローカルネットワーク

Webブラウザー、Talend StudioRemote Engine Gen2、Runtime Serverを含むローカルネットワーク。

  • Webブラウザーから、Talend Cloud Data PreparationTalend Dictionary ServiceTalend Management Consoleにアクセスできます。
  • Talend Studioからは、tDatasetInput、tDatasetOutput、tDataprepRunの各コンポーネントを使うことでTalend Cloud Data Preparationのファンクションを活用できます。さまざまなデータセットからデータセットを作成してTalend Cloud Data Preparationにエクスポートしたり、データ統合ジョブまたはSparkジョブでプレパレーションを直接利用したりできます。
  • Remote Engine Gen 1は、Data Preparationコンポーネントを使うジョブの実行、およびオンプレミスでのアーティファクトやタスクの実行に使用されます。
  • Remote Engine Gen2は、Talend Cloudアプリケーションのオブジェクト(プレパレーションなど)を実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。

クラウドインフラストラクチャー

クラウドインフラストラクチャーには、データセットサービスに依存するTalend Cloud Data Preparationの他にCloud Engine for Designが含まれています。

  • データセットサービスは、Talend Cloud Data PreparationTalend Cloud Data InventoryTalend Cloud Pipeline Designer用に統合されたデータセットリストを提供します。
  • Talend Management Consoleでは、ロール、ユーザー、プロジェクト、ライセンスを管理します。クラウドアプリケーションの新しいユーザーを作成し、カスタムグループに割り当てます。その後、ロールを決定してユーザーに割り当てます。Talend Management Consoleは、ライセンスファイルをインポートし、Talend Studioで共同作業するプロジェクトを作成するためも使用されます。加えて、Webユーザーのデータおよびファイル転送、データ統合、および共有データソースへのアクセスを有効にできます。たとえば、アプリケーション間のデータ交換と同期を自動化する、設定済みのサンプルタスクまたはデザインタスクをインポートして使用できます。
  • Talend Cloud Data Preparationでは、ローカルファイルやその他のソースからデータをインポートし、新しいプレパレーションを作成することでクレンジングしたりエンリッチ化したりできます。
  • Talend Dictionary Serviceでは、Talend Cloud Data Preparationで開かれている場合に、データの各カラムに適用されるセマンティックカテゴリーを追加、削除、変更できます。
  • Cloud Engine for Designは、アーティファクト、タスク、プレパレーションをクラウドで実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。