tDataprepRun - Cloud - 8.0

Data Preparation

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データプレパレーションコンポーネント
データガバナンス > サードパーティーシステム > データプレパレーションコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データプレパレーションコンポーネント

標準データ統合ジョブでTalend Data Preparationを使って作成したプレパレーションを適用します。

tDataprepRunは、Talend Data Preparationを使って作成したプレパレーションを取得し、一連のデータに適用します。

注: デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。Talend Studioで使用できるよう、機能マネージャーの[Data Integration] > [Components] (コンポーネント)セクションにTalend Data Preparationをインストールする必要があります。詳細は、機能マネージャーを使って機能をインストールをご覧ください。

Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。

使用しているTalend製品に応じて、このコンポーネントは次のジョブフレームワークの1つ、一部、またはすべてで使用できます。

  • 標準:tDataprepRunの標準プロパティを参照してください。

    注: 参考までに、tDataprepRunは60ステップのプレパレーションで最大1,000万行と100カラム(7GB)のデータセットを約200行/秒(150kB/秒)の速度で処理できます(ただしこの数値は目安であり、実際は異なる場合があります)。パフォーマンスを改善したい場合や1,000万行を超えるデータセットの場合は、Spark Jobの利用をご検討ください。

    このフレームワーク内のコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。

  • Spark Batch:Apache Spark BatchのtDataprepRunプロパティをご覧ください。

    このフレームワーク内のコンポーネントは、ビッグデータ対応のサブスクリプションTalend 製品すべて、およびTalend Data Fabricで利用できます。

  • Spark Streaming:Apache Spark StreamingのtDataprepRunプロパティをご覧ください。

    このコンポーネントは、Talend Real Time Big Data PlatformおよびTalend Data Fabricで利用できます。