Concepts de Talend Data Catalog - 7.3

Guide prise en main Talend Data Catalog

Version
7.3
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Catalog
Content
Gouvernance de données
Last publication date
2021-04-21
Ces définitions vous aideront à saisir les concepts principaux de Talend Data Catalog.
  • Catalogue

    Un catalogue est un inventaire de ressources de données, comme des tables de bases de données, des Jobs d'intégration de données ou des rapports de Business Intelligence.

  • Métadonnées

    Les métadonnées sont des informations structurées décrivant une ressource de données, notamment son nom, son type, son emplacement, son créateur, sa taille et ses relations avec les autres objets de données.

  • Référentiel des métadonnées

    Le référentiel des métadonnées stocke des métadonnées créées ou importées depuis des sources de données, des configurations de projets et des rapports.

  • Collecte de métadonnées

    Collecter des métadonnées signifie collecter toutes les métadonnées d'une source de données, via des ponts Talend Data Catalog. Les métadonnées sont importées dans un modèle et stockées dans le référentiel des métadonnées.

  • Pont

    Un pont est un connecteur dédié à une plateforme. Il utilise un pilote spécifique pour se connecter à un outil source de données et collecter ses métadonnées.

    Vous pouvez collecter des métadonnées à partir de data stores, d'outils d'intégration de données et d' Business Intelligence, ainsi que d'applications métier.

  • Connexions

    Une fois créés, les modèles sont liés les uns aux autres dans une configuration afin de définir le flux de données dans le système d'information.

  • Configuration

    Une configuration est un environnement ou un espace de travail dans lequel vous connectez des modèles les uns aux autres afin de construire un schéma global du système d'information de l'entreprise.

  • Glossaire

    Un glossaire capture et définit le vocabulaire de l'entreprise afin de construire un langage commun compréhensible par tous.

  • Profiling de données

    Le profiling de données est le processus consistant à examiner les données à partir de sources de données importées dans votre catalogue et à collecter des statistiques et des informations à propos de ces données.

  • Échantillonnage de données

    L'échantillonnage de données vous permet d'obtenir un aperçu du contenu des tables de bases de données et des fichiers de données importés dans votre catalogue.

  • Type sémantique

    Un type sémantique définit la structure ou les valeurs possibles des éléments.

    Au cours du processus de profiling de données et de collecte de métadonnées, Talend Data Catalog compare la valeur des données à celles des types sémantiques disponibles dans son dictionnaire. Lorsqu'une correspondance est trouvée, le type sémantique est automatiquement assigné.