Architecture de Talend Cloud Data Preparation - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Preparation
task
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données

Ce diagramme d'architecture identifie les blocs fonctionnels de Talend Cloud Data Preparation

Le diagramme est divisé en deux parties principales : le réseau local et l'infrastructure Cloud.

Réseau local

Le réseau local comprend un navigateur Web, un Studio Talend, et un moteur distant Gen 1 et un Moteur distant Gen2.

Depuis votre navigateur Web, vous pouvez accéder à l'application Talend Cloud Data Preparation.

Depuis le Studio Talend, vous pouvez tirer parti des fonctionnalités de Talend Cloud Data Preparation en utilisant les composants tDatasetInput, tDatasetOutput et tDataprepRun. Vous pouvez créer des jeux de données depuis différentes bases de données et les exporter dans Talend Cloud Data Preparation, ou bien utiliser vos préparations directement dans un Job d'intégration de données ou un Job Spark.

Le moteur distant Gen 1 est utilisé pour exécuter les Jobs utilisant les composants Data Preparation et pour exécuter des artefacts et des tâches on-premises.

Le Moteur distant Gen2 est utilisé pour exécuter des objets depuis les applications Talend Cloud, ainsi que pour créer des connexions et récupérer des échantillons de données.

Infrastructure Cloud

L'infrastructure Cloud comprend Talend Cloud Data Preparation, qui contient le service Dataset et le Moteur Cloud pour le design.
  • Le service Dataset fournit la liste unifiée des jeux de données pour Talend Cloud Data Preparation, Talend Cloud Data Inventory et Talend Cloud Pipeline Designer.
  • Talend Cloud Management Console permet de gérer les rôles, les utilisateurs et utilisatrices et les licences. Vous pouvez créer de nouveaux·elles utilisateurs·rices pour les applications Cloud et les attribuer à des groupes personnalisés. Vous pouvez définir des rôles et les attribuer à nombre d'utilisateurs et d'utilisatrices connecté·e·s. Talend Cloud Management Console permet également d'importer vos fichiers de licence. De plus, vous pouvez activer le transfert de données, l'intégration de données et l'accès à des sources de données partagées pour les utilisateurs et utilisatrices Web. Vous pouvez, par exemple, importer et utiliser des Tâches d'exemple pré-configurées, ou créer des Tâches automatisant les échanges et la synchronisation des données entre les applications.
  • Avec Talend Cloud Data Preparation, vous pouvez importer vos données, depuis des fichiers locaux ou d'autres sources, pour nettoyer et enrichir ces données via des préparations.
  • Dans Talend Dictionary Service, vous pouvez ajouter, supprimer ou modifier les catégories sémantiques appliquées à chaque colonne de vos données, lorsqu'elles sont ouvertes dans Talend Cloud Data Preparation.

Le Moteur Cloud pour le design est utilisé pour exécuter des artefacts, tâches et préparations dans le Cloud, ainsi que pour créer des connexions et récupérer des échantillons de données.