大規模データセットでの作業 - 2.5

Talend Data Preparation ユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
2.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation
デフォルトで大規模データセットと見なされるデータセットは、Talend Data Preparationでは10,000行を超える場合、Talend Data Preparationでは30,000行を超える場合です。

インポートできるデータセットのサイズについて何の制約もない場合でも、大規模データセットのエクスポート設定と表示は通常のデータセットとは異なります。たとえば、50,000行を含むデータセットがあるとします。

  • Talend Data Preparationでは、インポートは30,000行でカットされます。データセットの最初の30,000行しか準備およびエクスポートすることはできません。これはデフォルト値で、値をさらに小さく設定する場合は、インストールフォルダー内のapplication.propertiesファイルのdataset.records.limitパラメーターを編集します。

  • Talend Data Preparationでは、最初の10,000行が表示されているサンプルで作業を行うことができます。これはデフォルト値です。値をさらに大きく設定する場合は、インストールフォルダー内のapplication.propertiesファイルのdataset.records.limitパラメーターを編集します。最大値をより高く設定すると、アプリケーション性能が低下することがあります。設定可能な最大値はWebブラウザー、ネットワーク品質、マシンの性能によって左右されます。サンプルの最大値は10,000行までにしてください。

表示する行数のデフォルト値を変更する場合、変更時点からインポートされるデータセットだけに変更が適用され、既存のデータセットには適用されません。