Talend Data Fabric機能アーキテクチャ - 7.1

Talend Data Fabric入門ガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio

Talend Data Fabric論理機能アーキテクチャは、Talend Data Fabric機能、相互作用、および対応するITニーズを特定するアーキテクチャモデルです。アーキテクチャ全体は、特定の機能を機能ブロックに分離することで説明されています。

下の図は、主なアーキテクチャ機能ブロックを示しています。

機能ブロックのタイプは、以下のとおりです。

  • Talend Studioから、Hadoopクラスターを活用するビッグデータジョブをデザインして起動し、大量のデータセットを処理します。これらのジョブは、起動すると、このHadoopクラスターに送られ、そこでデプロイされ、実行されます。

    Studioから、定義済みのパターンとインジケーターを使用して、さまざまなデータソースに保存されているデータを分析し、分析結果を参照およびクエリーして、破損した、不完全な、または不正確なデータを削除することもできます。

  • Talendシステムから独立したHadoopクラスターでは、大量のデータセットを処理します。

  • ジョブをデプロイして実行するためにHadoopクラスターの中または外にインストールされたTalend JobServerまたはRuntime。

    Hortonworksクラスターの場合は、ファイアウォールやアクセスの問題を避けるために、JobServerまたはRuntimeをエッジノードのマシンにインストールすることをお勧めします。

    Amazon EMRクラスターの場合も、JobServerまたはRuntimeをクラスターにインストールすることをお勧めします。

  • Talend DQ Portalから、分析結果に関するレポートを生成し、他のビジネスユーザーと共有することができます。