並列にデータを書き込む - Cloud - 8.0

Talend Studioユーザーガイド

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
並列データ書き込みとは、データフローを複数のフラグメントに分割し、同時にデータを書き込んで、ジョブの実行を高速化する概念のことをいいます。

このタスクについて

並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得することはできないことにご注意ください。

すべてのデータベース出力コンポーネントについて高度な設定には、[Enable parallel execution] (並列実行を有効化)オプションが含まれ、このオプションを選択すると、複数のデータフローを同時に扱う高速データ処理が可能になります。

[Enable parallel execution] (並列実行を有効化)チェックボックスをオンにすると、[Number of parallel executions] (並列実行数)フィールドが表示され、ここに数字を入力すると現在の処理データでN重並列処理を実行できるようになります。

現在の処理データをN個のフラグメントに分けて実行すると、1つのフラグメントで処理するよりもN倍高速に実行できる場合があります。

データフローの並列化パラメーターは、Integrationパースペクティブのデザインワークスペースから設定することもできます。これを設定するには、以下のようにします:

手順

  1. デザインワークスペースでDB出力コンポーネントを右クリックして、ドロップダウンリストから[Parallelize] (並列化)を選択します。
  2. [Enable parallel execution] (並列実行を有効化)チェックボックスをオンにして、該当するフィールドに並列実行数を入力します。または、Ctrl + スペースを押して、リストから適切なコンテキスト変数を選択します。
  3. [OK] をクリックして、データフローの並列化パラメーターを確定します。
    並列実行数が、デザインワークスペース内のDB出力コンポーネントの横に表示されます。