並列化タブ - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data

Big Data Platform

Cloud API Services Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

[Parallelization] (並列化)タブは、行接続の設定に使用できる設定タブの1つです。

行接続の並列化プロパティを次のテーブルに基づいて定義できます。

フィールド/オプション

説明

[Partition row]

入力レコードを一定数のスレッドに分割する必要がある時に、このオプションを選択します。

注:

フローの最後の行接続には利用できません。

[Departition row]

処理された並列スレッドの出力を再度グルーピングする必要がある時に、このオプションを選択します。

注:

フローの最初の行接続には利用できません。

[Repartition row]

入力スレッドを一定数のスレッドに分割し、処理された並列スレッドの出力を再度グルーピングする必要がある時に、このオプションを選択します。

注:

フローの最初または最後の行接続には利用できません。

[None] (なし)

デフォルトオプション。入力レコードについて何のアクションも取らない場合は、このオプションを選択します。

[Merge sort partitions] (パーティションのマージ/ソート)

このチェックボックスをオンにし、マージ/ソートアルゴリズムを実装してデータの一貫性を保証します。

このチェックボックスは、[Departition row]オプションまたは[Repartition row]オプションを選択すると表示されます。

[Number of Child Threads] (子スレッドの数)

入力レコードをスレッドに分解する場合、スレッドの数を入力します。

このフィールドは、[Partition row]オプションまたは[Departition row]オプションを選択すると表示されます。

[Buffer Size] (バッファーサイズ)

生成された個別のスレッドでキャッシュする行数を入力します。

[None] (なし)オプションを選択した場合、このフィールドは表示されません。

[Use a key hash for partitions] (分割用にキーハッシュを使用)

このチェックボックスをオンにして入力レコードの転送にハッシュモードを使用します。これにより同じ条件を満たすレコードが同じスレッドに転送されるようにします。これ以外の場合の、転送モードは総当り方式になります。

このチェックボックスは、[Partition row]オプションまたは[Repartition row]オプションを選択すると表示されます。

このチェックボックスをオンにした後に表示される[Key Columns] (キーカラム)テーブルで、ハッシュモードを使用するカラムを設定します。