並列化タブ - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

[Parallelization] (並列化)タブは、行接続の設定に使用できる設定タブの1つです。

行接続の並列化プロパティを次のテーブルに基づいて定義できます。

フィールド/オプション

説明

[Partition row]

入力レコードを一定数のスレッドに分割する必要がある時に、このオプションを選択します。

注:

フローの最後の行接続には利用できません。

[Departition row]

処理された並列スレッドの出力を再度グループ化する必要がある時に、このオプションを選択します。

注:

フローの最初の行接続には利用できません。

[Repartition row]

入力スレッドを一定数のスレッドに分割し、処理された並列スレッドの出力を再度グループ化する必要がある時に、このオプションを選択します。

注:

フローの最初または最後の行接続には利用できません。

[None] (なし)

デフォルトオプション。入力レコードについて何のアクションも取らない場合は、このオプションを選択します。

[Merge sort partitions] (パーティションのマージ/ソート)

このチェックボックスをオンにし、マージ/ソートアルゴリズムを実装してデータの一貫性を保証します。

このチェックボックスは、[Departition row]オプションまたは[Repartition row]オプションを選択すると表示されます。

[Number of Child Threads] (子スレッドの数)

入力レコードをスレッドに分解する場合、スレッドの数を入力します。

このフィールドは、[Partition row]オプションまたは[Departition row]オプションを選択すると表示されます。

[Buffer Size] (バッファサイズ)

生成された個別のスレッドでキャッシュする行数を入力します。

[None] (なし)オプションを選択した場合、このフィールドは表示されません。

[Use a key hash for partitions] (分割用にキーハッシュを使用)

このチェックボックスをオンにして入力レコードの転送にハッシュモードを使用します。これにより同じ条件を満たすレコードが同じスレッドに転送されるようにします。これ以外の場合の、転送モードは総当り方式になります。

このチェックボックスは、[Partition row]オプションまたは[Repartition row]オプションを選択すると表示されます。

このチェックボックスをオンにした後に表示される[Key Columns] (キーカラム)テーブルで、ハッシュモードを使用するカラムを設定します。