Nettoyage du référentiel - 8.0

Guide d'installation et de migration de Talend Data Catalog

Version
8.0
Language
Français
Operating system
Linux
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Catalog
Content
Installation et mise à niveau
Last publication date
2024-01-29

Vous devez nettoyer le référentiel en préparation à la mise à niveau du serveur Talend Data Catalog.

Le référentiel peut contenir du contenu obsolète ou non utilisé. Comme ce contenu est en production et indexé, il y a un impact sur la performance et l'espace mémoire de la base de données.

Assurez-vous que la base de données dispose d'au moins 20 % d'espace disponible. Le processus de mise à niveau peut prendre plusieurs heures dans le cas de référentiels volumineux mais peut également nécessiter de l'espace supplémentaire pour les données temporaires durant la migration.

Travaillez avec la base de données de votre référentiel pour vous assurez de la propreté de la base de données.

Voici des actions possibles pour libérer de l'espace.

Suppression des tests non utilisés ou de contenus de type sandbox

  1. Parcourez le référentiel pour identifier du contenu non utilisé.
  2. Supprimez-le du gestionnaire de référentiel.

Suppression des versions de configurations non utilisées

Vous conservez une copie des configurations créées pour la sauvegarde ou l'historique d'analyses ou une nouvelle version est créée à chaque fois que la totalité des métadonnées est collectée dans votre processus de gestion de la configuration.

Ces copies peuvent affecter l'espace disponible de la base de données ainsi que ses performances. Elles peuvent aussi utiliser des ressources comme de la mémoire disponible sur le disque, la taille de l'index ou les performances de la recherche.

Il est préférable de supprimer ces versions de configurations non utilisées et anciennes :
  1. Allez dans Manage (Gestion) > System (Système).
  2. Exécutez l'opération Get repository configuration statistics (Obtenir les statistiques de configuration du référentiel) à partir de la liste déroulante Operations (Opérations).

    Dans le cas où il existe une différence importante entre le nombre de versions de configurations et le nombre total de configurations, procédez comme suit.

  3. Parcourez le référentiel pour identifier des versions anciennes.
  4. Supprimez-les du gestionnaire de référentiel.

Suppression des versions des modèles non utilisées

De la même manière qu'il est nécessaire de supprimer les versions de configurations inutilisées, supprimez les versions des modèles anciens et inutilisés.
  1. Parcourez le référentiel pour identifier des versions anciennes.
  2. Cliquez sur Manage (Gestion) > Schedules (Plannings).
  3. Configurez et exécutez l'opération Delete unused versions (Supprimer les versions non utilisées).

    Cette opération supprime une version d'un modèle si cette version n'est pas utilisée dans une version de la configuration et si cette version a été importée plus d'une heure auparavant et depuis moins d'un nombre de jours spécifié.

Vérification de l'activation de l'option de collecte incrémentale dans les paramètres du modèle

L'option de collecte incrémentale économise du temps de traitement lors de l'import et nécessite moins d'espace. Seule la partie du modèle modifiée est réimportée et écrite en tant que nouvelle version dans la base de données du référentiel. Le reste du contenu est réutilisé dans la nouvelle version. Cela vaut pour les bases de données volumineuses, les systèmes de fichiers et les serveurs de Business Intelligence.

Cette option peut être désactivée manuellement avec l'ajout de l'option -cache.clear dans le paramètre Miscellaneous (Divers).

Vérifiez que, pour chaque modèle volumineux, l'option n'a pas été désactivée manuellement (lorsqu'elle est disponible) :
  1. Ouvrez les paramètres d'import de chaque modèle.
  2. Si vous voyez l'option -cache.clear dans le paramètre Miscellaneous (Divers), enlevez-la.
  3. Sauvegardez vos modifications.

Suppression des logs d'opération

Les logs d'opération ne sont pas indexés et ne devraient pas affecter la performance, cependant ils peuvent prendre beaucoup d'espace. Cela vaut pour les bases de données volumineuses, les systèmes de fichiers et les serveurs de Business Intelligence.

Supprimez les logs d'opération :
  1. Cliquez sur Manage (Gestion) > Schedules (Plannings).
  2. Configurez et exécutez l'opération Delete operation logs(Supprimer les logs d'opération).

    Cette opération supprime les opérations complétées ainsi que leurs logs si leur date est plus ancienne d'un nombre de jours spécifié. Vous pouvez supprimer les logs des opérations ayant échoué ou les logs d'opérations réussies et échouées.

Désactivation de l'option des logs de débogage dans Gestion du système

Les logs de débogage ne sont pas indexés et ne devraient pas affecter la performance, cependant il peuvent prendre beaucoup d'espace. Cela vaut pour les bases de données volumineuses, les systèmes de fichiers et les serveurs de Business Intelligence.

Dans le cas où vous utilisez cette option pour tester ou reporter un ticket, désactivez-la une fois chose faite.
  1. Allez dans Manage (Gestion) > System (Système).
  2. Dans le champ Debug logging (Logs de débogage), sélectionnez Disable (Désactiver) à partir de la liste déroulante.

Exécution de l'opération de maintenance de la base de données

Exécutez l'opération de maintenance de la base de données afin de terminer les actions précédemment exécutées pour nettoyer le référentiel.
  1. Cliquez sur Manage (Gestion) > Schedules (Plannings).
  2. Configurez et exécutez l'opération Run database maintenance (Exécuter la maintenance de la base de données).

    Cette opération permet de maintenir les index et statistiques des bases de données.

    Si un nombre important de contenus et de versions est supprimé d'un coup, vous devrez exécuter l'opération plusieurs fois.

Vous êtes prêt·e à mettre à jour Talend Data Catalog avec les derniers patchs.