Concepts de Talend Cloud Data Catalog - Cloud

Guide de prise en main de Talend Cloud Data Catalog

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Catalog
task
Gouvernance de données
Ces définitions vous aideront à saisir les concepts principaux de Talend Cloud Data Catalog.
  • Catalogue

    Un catalogue est un inventaire de ressources de données, comme des tables de bases de données, des Jobs d'intégration de données ou des rapports de Business Intelligence.

  • Métadonnées

    Les métadonnées sont des informations structurées décrivant une ressource de données, notamment son nom, son type, son emplacement, son créateur, sa taille et ses relations avec les autres objets de données.

  • Référentiel des métadonnées

    Le référentiel des métadonnées stocke des métadonnées créées ou importées depuis des sources de données, des configurations de projets et des rapports.

  • Collecte de métadonnées

    Collecter des métadonnées signifie collecter toutes les métadonnées d'une source de données, via des ponts Talend Cloud Data Catalog. Les métadonnées sont importées dans un modèle et stockées dans le référentiel des métadonnées.

  • Pont

    Un pont est un connecteur dédié à une plateforme. Il utilise un pilote spécifique pour se connecter à un outil source de données et collecter ses métadonnées.

    Vous pouvez collecter des métadonnées à partir de data stores, d'outils d'intégration de données et d' Business Intelligence, ainsi que d'applications métier.

  • Connexions

    Une fois créés, les modèles sont liés les uns aux autres dans une configuration afin de définir le flux de données dans le système d'information.

  • Configuration

    Une configuration est un environnement ou un espace de travail dans lequel vous connectez des modèles les uns aux autres afin de construire un schéma global du système d'information de l'entreprise.

  • Glossaire

    Un glossaire capture et définit le vocabulaire de l'entreprise afin de construire un langage commun compréhensible par tous.

  • Profiling de données

    Le profiling de données est le processus consistant à examiner les données à partir de sources de données importées dans votre catalogue et à collecter des statistiques et des informations à propos de ces données.

  • Échantillonnage de données

    L'échantillonnage de données vous permet d'obtenir un aperçu du contenu des tables de bases de données et des fichiers de données importés dans votre catalogue.

  • Type sémantique

    Un type sémantique définit la structure ou les valeurs possibles des éléments.

    Au cours du processus de profiling de données et de collecte de métadonnées, Talend Cloud Data Catalog compare la valeur des données à celles des types sémantiques disponibles dans son dictionnaire. Lorsqu'une correspondance est trouvée, le type sémantique est automatiquement assigné.