並列データ書き込み - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio
並列データ書き込みとは、データフローを複数のフラグメントに分割し、同時にデータを書き込んで、ジョブの実行を高速化する概念のことをいいます。

このタスクについて

並列実行を有効にすると、グローバル変数を使ってサブジョブで戻り値を取得することはできないことに注意して下さい。

全てのデータベース出力コンポーネントについて高度な設定には、[Enable Parallel Execution] (並列実行の有効化)オプションが含まれ、このオプションを選択すると、複数のデータフローを同時に扱う高速データ処理が可能になります。

[Enable Parallel Execution] (並列実行の有効化)チェックボックスを選択すると、[Number of parallel executions] (並列実行数)フィールドが表示され、ここに数字を入力すると現在の処理データでN重並列処理を実行できるようになります。

現在の処理データをN個のフラグメントに分けて実行すると、1つのフラグメントで処理するよりもN倍高速に実行できる場合があります。

データフローの並列化パラメーターは、Integrationパースペクティブのデザインワークスペースから設定することもできます。これを設定するには、次の手順に従います。

手順

  1. デザインワークスペースでDB出力コンポーネントを右クリックして、ドロップダウンリストから[Parallelize] (並列化)を選択します。
  2. [Enable parallel execution] (並列実行の有効化)チェックボックスを選択して、該当するフィールドに並列実行数を入力します。または、[Ctrl + スペース]を押して、リストから適切なコンテキスト変数を選択します。
  3. [OK] をクリックして、データフローの並列化パラメーターを確定します。
    並列実行数が、デザインワークスペース内のDB出力コンポーネントのとなりに表示されます。