Définir le seuil maximal de la mémoire

Talend Open Studio for Data Quality Guide utilisateur

EnrichVersion
6.2
EnrichProdName
Talend Open Studio for Data Quality
task
Qualité et préparation de données
EnrichPlatform
Studio Talend

Dans le studio, vous pouvez contrôler l'utilisation de la mémoire lorsque vous utilisez le moteur Java pour exécuter deux types d'analyses : analyse de colonne(s) et analyse d'un ensemble de colonnes.

Pourquoi limiter l'utilisation de la mémoire ? Si vous utilisez une analyse de colonne(s) ou une analyse d'un ensemble de colonnes pour profiler des ensembles de données très volumineux ou contenant des données avec de nombreuses erreurs, il est possible que la mémoire sature et fasse une erreur Java heap space (erreur de tas Java). En configurant la taille maximale de mémoire à utiliser pour ces analyses, le Studio arrête l'exécution de l'analyse lorsque la limite est atteinte et vous fournit les résultats de l'analyse tels qu'ils ont été mesurés sur les données avant l'arrêt de l'exécution de l'analyse.

Pour configurer le seuil maximal de la mémoire, procédez comme suit :

  1. Dans la barre de menu, sélectionnez Window > Preferences pour afficher la boîte de dialogue [Preferences].

  2. Vous pouvez :

    • développer les nœuds Talend > Profiling et sélectionner Analysis tuning, ou

    • commencer à saisir analysis tuning dans le champ de filtre dynamique.

  3. Dans la zone Memory, cochez la case Enable analysis thread memory control.

  4. Déplacez le curseur vers la droite afin de configurer le seuil de la mémoire auquel l'exécution de l'analyse s'arrête.

L'exécution d'une analyse de colonne(s) ou d'un ensemble de colonnes s'arrête si la taille de la mémoire allouée est dépassée. Les résultats de l'analyse donnés dans le Studio couvrent les données analysées avant l'interruption de l'exécution de l'analyse.