departitioningステップの設定 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

手順

  1. departitioningステップを表すリンクをクリックして、[Component] (コンポーネント)ビューを開き、[Parallelization] (並列化)タブをクリックします。
    [Partition row]オプションは、[Type] (タイプ)エリアで自動的に選択されています。[None] (なし)オプションを選択すると、このリンクで処理するデータフローの並列化が無効になります。リンクの設定に基づき、[Repartition row]オプションが[Type] (タイプ)エリアで利用可能になり、すでに分割解除されたデータフローを再分割できる場合があります。
    この[Parallelization] (並列化)ビューでは、次のプロパティを定義する必要があります。
    • [Buffer Size] (バッファサイズ): メモリを解放する前に処理する行数。

    • [Merge sort partitions] (分割のマージ/ソート): これによりマージ/ソートアルゴリズムを実装してデータの一貫性を確保できます。

  2. 必要に応じて、メモリ容量に合わせて[Buffer Size] (バッファサイズ)フィールドの値を変更します。この例では、デフォルトのままにしておきます。