複数のサブジョブの並列実行 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

[Multi thread execution] (マルチスレッド実行)フィーチャーを使うと、ワークスペースでアクティブな複数のサブジョブを並列に実行することができます。

以前のセクションで説明したように、ワークスペースで開かれたジョブはいくつかのサブジョブを含み、[OnSubjobOK]などのトリガーリンクを使って、実行順序を並べ替えることができます。ただし、依存性が存在しない複数のサブジョブは、同時に起動するようにもできます。たとえば、次の図は1つのジョブに4つのサブジョブがあり、それらのサブジョブ間に依存性がないことを示しています。

この例では[tRunJob]コンポーネントを使用して、各サブジョブを呼び出します。tRunJobの詳細は、tRunJob を参照して下さい。

次にワークスペースで開かれているジョブの場合、サブジョブを並列に実行するには以下のようにします:

手順

  1. [Job] (ジョブ)タブをクリックして、次に[Extra] (追加)タブをクリックして表示します。
  2. [Multi thread execution] (マルチスレッド実行)チェックボックスをオンにして、並列実行を有効にします。
    このフィーチャーはスレッド数(一般に1つのサブジョブで1スレッド)が並列実行に使用するマシンのプロセッサー数を超えない場合に最適化されます。超える場合、いずれかのプロセッサーが解放されるまで待機するサブジョブが出てきます。
  3. 必要に応じて、データが処理され、バッファがクレンジングされるまでの間に並行処理される各スレッドにバッファとして与える行数を[Parallelize Buffer Unit Size] (バッファユニットサイズの並列化)フィールドに入力します。
    この設定は、[Enable parallel execution] (並列実行の有効化)チェックボックスが選択されており、子ジョブまたはサブジョブにデータベース出力コンポーネントが含まれている場合にのみ意味を持ちます。
    このフィーチャーを利用してジョブを並行して実行する場合のユースケースは、『マルチスレッド実行フィーチャーを使ったジョブの並列実行』を参照して下さい。