Architecture fonctionnelle de Talend Data Integration - 7.1

Guide de prise en main de Talend Data Integration

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Integration
task
Création et développement
Installation et mise à niveau
EnrichPlatform
Studio Talend
Talend Administration Center
Talend Installer
Talend Runtime

L'architecture fonctionnelle de Talend Data Integration est un modèle architectural qui identifie les fonctions, les interactions et les besoins informatiques correspondants de Talend Data Integration. L'architecture d'ensemble a été décrite en isolant les fonctionnalités spécifiques en blocs fonctionnels.

Le graphique suivant illustre les blocs fonctionnels de l'architecture principale.

Plusieurs de ces blocs fonctionnels sont définis :

  • Le bloc Clients inclut un ou plusieurs Studio Talend et navigateur(s) Web pouvant être sur la même machine ou sur des machines différentes.

    Dans le Studio, vous pouvez mener à bien des processus d'intégration de données sans tenir compte du volume des données et de la complexité des processus. Le Studio Talend vous permet de travailler sur les projets pour lesquels vous avez les droits d'accès.

    Depuis le navigateur Web, vous pouvez vous connecter :

    • à un Talend Administration Center distant, via un protocole HTTP sécurisé

    • l’application Web Talend Data Preparation, où vous pouvez importer vos données, depuis vos fichiers locaux ou bien d’autres sources, pour les nettoyer ou les enrichir en créant de nouvelles préparations sur ces données

    • l’application Web Talend Data Stewardship, d’où les Campaign Owners et arbitres de données peuvent gérer tâches et campagnes

  • Le bloc Server comprend :

    • une application Web, Talend Administration Center, permettant la gestion et l'administration de tous les projets:
      • les métadonnées d'administration (comptes d'utilisateurs, droits d'accès et autorisations des projets, par exemple) sont stockées dans la base de données d’administration
      • les données des éléments de projets (Jobs, Business Models et Routines par exemple) sont stockées sur le serveur SVN ou Git.
    • les serveurs utilisés par les applications Web Talend, telles que Talend Data Preparation, Talend Data Stewardship et Talend Dictionary Service, et le serveur Identity Access Management qui permet d’activer l’authentification unique pour ces applications.

  • Le bloc Repositories inclut le serveur SVN ou Git et le référentiel Nexus.

    Le serveur SVN ou Git est utilisé pour centraliser tous les éléments des projets tels que les Jobs et les Business Models partagés entre les différents utilisateurs finaux et est accessible depuis le Studio Talend afin de développer les éléments de projets et à partir de Talend Administration Center pour les publier, déployer et monitorer.

    Le référentiel Nexus est utilisé pour stocker :

    • les mises à jour du logiciel (Software Updates) disponibles au téléchargement,

    • les Jobs publiés depuis le Studio Talend prêts à être déployés et exécutés.

  • Le bloc Talend Execution Servers représente un ou plusieurs serveurs d'exécution, déployé(s) dans votre système d'information. Les Jobs Talend sont déployés sur le Job Serveur à travers le Job Conductor du Centre d'administration, afin d'être exécutés à une heure, date ou moment programmé(e).

  • Le bloc Databases représente les bases de données d'Administration, d'Audit et de Monitoring. La base de données d'Administration est utilisée pour gérer les comptes d'utilisateurs, droits d'accès et autorisations des projets notamment. La base de données Audit est utilisée pour évaluer les différents aspects des Jobs implémentés dans des projets développés dans le Studio Talend. Cette opération permet de fournir de solides facteurs quantitatifs et qualitatifs au support décisionnel orienté processus.