Configurer la taille d'un échantillon de jeux de données - 7.2

Guide d'utilisation de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Par défaut, pour des performances optimales, Talend Data Preparation limite le nombre de lignes affichées dans la grille à 10000 lignes.

Cela signifie que si vous importez un jeu de données de 50000 lignes, seules les 10000 premières lignes seront affichées dans l'application. Cette limite s'applique à tous les types de jeux de données. Cependant, cette valeur n'est pas programmée en dur et peut être modifiée en modifiant le fichier de configuration de Talend Data Preparation.

Procédure

  1. Pour changer le nombre maximal de lignes pouvant s'afficher pour vos jeux de données, ouvrez le fichier <Data_Preparation_Path>/config/application.properties.
  2. Modifiez la valeur du paramètre dataset.records.limit en saisissant celle que vous souhaitez.
    La valeur par défaut est 10000 ; vous pouvez donc changer la propriété en dataset.records.limit=30000, par exemple.
  3. Enregistrez le fichier et redémarrez l'instance de Talend Data Preparation.

Résultats

Désormais, lorsque vous ouvrirez un jeu de données dans Talend Data Preparation, un échantillon de 30000 lignes maximum s'affichera dans la grille.

Les jeux de données mis en cache avant la mise à jour du fichier de configuration conserveront les anciens paramètres. De ce fait, il est conseillé de vider votre cache après cette opération.