コンポーネント固有設定 - 7.0

tUniqRowジョブスクリプトプロパティ

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend CommandLine
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 重複除外コンポーネント
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 重複除外コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 重複除外コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント

コンポーネントのsetSettings {}関数で定義できるジョブスクリプトの関数とパラメーターは、以下の表のとおりです。

関数/パラメーター 説明 必須?

UNIQUE_KEY {}

この関数は、次のパラメーターを使用して、重複を排除するカラムを指定します。

  • SCHEMA_COLUMN: このパラメーターを使って、カラム名を指定します。
  • KEY_ATTRIBUTE: このパラメーターをtrueに設定すると、指定カラムの重複排除が実行されます。

    デフォルトでは、このパラメーターはfalseに設定されます。

  • CASE_SENSITIVE: このパラメーターをtrueに設定すると、大文字と小文字が区別されます。

    デフォルトでは、このパラメーターはfalseに設定されます。

はい

ONLY_ONCE_EACH_

DUPLICATED_KEY

キーとして定義されているカラム内の最初の重複エントリのみを重複用出力フローに送信する場合は、このパラメーターをtrueに設定します。

デフォルトでは、このパラメーターはfalseに設定されます。

いいえ

IS_VIRTUAL_COMPONENT

このパラメーターをtrueに設定すると、大量のデータの処理時、ハードディスクに一時ファイルを生成できます。これにより、メモリオーバーフローが原因のジョブ実行エラーを回避できます。

このパラメーターをtrueに設定する場合は、BUFFER_SIZEパラメーターとTEMP_DIRECTORYパラメーターも定義する必要があります。

デフォルトでは、このパラメーターはfalseに設定されます。

いいえ

BUFFER_SIZE

このパラメーターを使ってバッファーサイズを指定できます。つまり、一時ファイルがハードディスクに生成される前に、メモリに保持できる行数を指定できます。

使用できる値は次のとおりです。

  • S: 小。50万行。
  • M: 中。100万行。
  • B: 大。200万行。

はい(IS_VIRTUAL_COMPONENTtrueに設定されている場合)

TEMP_DIRECTORY

このパラメーターは、一時ファイルの格納先を指定します。

警告:

一時ファイル用には既存のディレクトリを指定するようにして下さい。そうでない場合、ジョブの実行時にエラーが発生します。

はい(IS_VIRTUAL_COMPONENTtrueに設定されている場合)

CHANGE_HASH_AND_

EQUALS_FOR_

BIGDECIMAL

Big Decimalデータの末尾のゼロを無視する場合は、このパラメーターをtrueに設定します。

デフォルトでは、このパラメーターはfalseに設定されます。

いいえ

TSTATCATCHER_STATS

各コンポーネントレベルおよびジョブレベルで処理メタデータを収集する場合、このパラメーターをtrueに設定します。

デフォルトでは、このパラメーターはfalseに設定されます。

いいえ

LABEL

このパラメーターを使って、コンポーネントのテキストラベルを指定します。

いいえ