- Catalogue
Un catalogue est un inventaire de ressources de données, comme des tables de bases de données, des Jobs d'intégration de données ou des rapports de Business Intelligence.
- Métadonnées
Les métadonnées sont des informations structurées décrivant une ressource de données, notamment son nom, son type, son emplacement, son créateur, sa taille et ses relations avec les autres objets de données.
- Référentiel des métadonnées
Le référentiel des métadonnées stocke des métadonnées créées ou importées depuis des sources de données, des configurations de projets et des rapports.
- Collecte de métadonnées
Collecter des métadonnées signifie collecter toutes les métadonnées d'une source de données, via des ponts Talend Data Catalog. Les métadonnées sont importées dans un modèle et stockées dans le référentiel des métadonnées.
- Pont
Un pont est un connecteur dédié à une plateforme. Il utilise un pilote spécifique pour se connecter à un outil source de données et collecter ses métadonnées.
Vous pouvez collecter des métadonnées à partir de data stores, d'outils d'intégration de données et d' Business Intelligence, ainsi que d'applications métier.
- Connexions
Une fois créés, les modèles sont liés les uns aux autres dans une configuration afin de définir le flux de données dans le système d'information.
- Configuration
Une configuration est un environnement ou un espace de travail dans lequel vous connectez des modèles les uns aux autres afin de construire un schéma global du système d'information de l'entreprise.
- Glossaire
Un glossaire capture et définit le vocabulaire de l'entreprise afin de construire un langage commun compréhensible par tous.
- Profiling de données
Le profiling de données est le processus consistant à examiner les données à partir de sources de données importées dans votre catalogue et à collecter des statistiques et des informations à propos de ces données.
- Échantillonnage de données
L'échantillonnage de données vous permet d'obtenir un aperçu du contenu des tables de bases de données et des fichiers de données importés dans votre catalogue.
- Type sémantique
Un type sémantique définit la structure ou les valeurs possibles des éléments.
Au cours du processus de profiling de données et de collecte de métadonnées, Talend Data Catalog compare la valeur des données à celles des types sémantiques disponibles dans son dictionnaire. Lorsqu'une correspondance est trouvée, le type sémantique est automatiquement assigné.
Ces définitions vous aideront à saisir les concepts principaux de Talend Data Catalog.