Talend Data Catalog en mode cluster actif-passif - 7.3

Guide d'installation et de migration de Talend Data Catalog

Version
7.3
Language
Français
Operating system
Linux
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Catalog
Content
Installation et mise à niveau
Last publication date
2023-03-15

Selon votre licence, vous pouvez installer une configuration à deux serveurs, active-passive, basée sur une base de données distribuée afin de bénéficier d'une haute disponibilité de votre produit.

Le clustering est le processus de regroupement d'un ensemble de systèmes physiques similaires afin d'assurer un certain niveau de continuité opérationnelle et de minimiser les risques d'arrêt non planifié, notamment en tirant parti des fonctionnalités de failover.

Le failover vous permet de basculer automatiquement vers un second serveur si le serveur principal est en panne ou inaccessible de façon temporaire.

Remarque : Une configuration de cluster ne peut pas être installée sur le serveur directement.

Architecture de Talend Data Catalog en mode cluster actif-passif

Le diagramme suivant illustre l'architecture derrière Talend Data Catalog lors d'une configuration en mode cluster.

Cette architecture se compose de plusieurs blocs fonctionnels :

  • Deux serveurs d'application Talend Data Catalog ont été installés sur différentes machines. Chaque instance de serveur héberge une installation du serveur d'Apache Tomcat identique et se trouve sur un serveur de fichiers partagés. Seul un serveur à la fois est en cours d'exécution, c'est le serveur actif. L'autre serveur est passif et n'accède pas au serveur de fichiers partagés.

    Vous pouvez obtenir une licence fonctionnant pour les deux serveurs en fournissant deux fichiers HostInfo.xml, un pour chaque serveur, dans votre requête de licence.

  • Toutes les instances du serveur d'application sont connectées à la base de données distribuée.

    Pour plus d'informations, référez-vous à la documentation correspondante de votre fournisseur de base de données.

  • Un logiciel de haute disponibilité est installé sur chaque instance. Le logiciel de gestion de haute disponibilité détecte lorsque le serveur principal est arrêté et démarre le second serveur. Avant de le démarrer, le système de haute disponibilité doit déverrouiller tous les fichiers dans le répertoire data.

    Cette fonction n'est pas fournie par Talend et doit donc être implémentée séparément.

  • Un serveur de fichiers partagé est implémenté pour stocker et partager toutes les données d'application, y compris le répertoire data et les fichiers de log entre les instances. Vous pouvez définir le répertoire data via le paramètre M_DATA_DIRECTORY dans le fichier <TDC_HOME>/conf/conf.properties ou via le champ Data Directory dans l'utilitaire de configuration Setup.

    Le serveur de Talend Data Catalog verrouille les fichiers dans le répertoire data lorsqu'il y accède et les déverrouille lorsqu'il a terminé. S le serveur primaire verrouille encore des fichiers lorsqu'il est arrêté, le démarrage du serveur secondaire échoue car il doit accéder à ces fichiers. Vous pouvez implémenter un script pour déverrouiller les fichiers dans le répertoire data avant de démarrer le serveur secondaire.

    Cette fonction n'est pas fournie par Talend et doit donc être implémentée séparément.