Talendジョブ内のtDataprepRunワークフロー - 7.3

Data Preparation

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データプレパレーションコンポーネント
データガバナンス > サードパーティーシステム > データプレパレーションコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データプレパレーションコンポーネント
Last publication date
2024-02-22

Talend Studioでは、tDataprepRunコンポーネントを使用してジョブを実行すると、Talend Data Preparationで準備されたデータを取得してジョブのフローで使用できるように、いくつかのエレメントが機能します。

次の図は、tDataprepRunコンポーネントを使用してTalendデータ統合ジョブとビッグデータジョブでプレパレーションを取得する時にランタイムに発生する一連のイベントを示しています。どちらの場合も、最初のステップは、ユーザーがtDataprepRunコンポーネントを含むジョブを作成することです。

プレパレーションバージョンでtDataprepRunコンポーネントを使用することをお勧めします。これにより、ジョブが期間中にずっと有効であり、予測可能な結果が保証され、同じプレパレーションステップの適用が保証されます。これにより、プレパレーションのスキーマが進展した状況を防ぐことができますが、他のコンポーネントのスキーマは進展していないため、ジョブが中断されます。

データ統合ジョブでのtDataprepRun

データ統合ジョブのフローでプレパレーションを実行すると、プレパレーションはTalend Data Preparationサーバーで直接処理されます。

ビッグデータSpark BatchまたはSpark StreamingジョブでのtDatapreprun

ビッグデータジョブのフローでプレパレーションを実行すると、プレパレーション定義がTalend Data Preparationサーバーから取得され、実行時にBig Dataクラスターで処理されます。