デパーテーション化ステップの設定 - 7.3

Talend Big Data Platform Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発

手順

  1. デパーテーション化ステップを表すリンクをクリックして、[Component] (コンポーネント)ビューを開き、[Parallelization] (並列化)タブをクリックします。
    [Partition row] (パーテーション行)オプションは、[Type] (タイプ)エリアで自動的に選択されています。[None] (なし)オプションを選択すると、このリンクで処理するデータフローの並列化が無効になります。設定するリンクによっては、[Repartition row] (パーテーション行)オプションが[Type] (タイプ)エリアで利用可能となり、既に分割解除されているデータフローを再分割できます。
    この[Parallelization] (並列化)ビューでは、次のプロパティを定義する必要があります。
    • [Buffer Size] (バッファーサイズ): メモリを解放する前に処理する行数。

    • [Merge sort partitions] (分割のマージ/ソート): これによりマージ/ソートアルゴリズムを実装してデータの一貫性を確保できます。

  2. 必要に応じて、メモリ容量に合わせて[Buffer Size] (バッファーサイズ)フィールドの値を変更します。この例では、デフォルトのままにしておきます。