Principaux concepts de Talend Cloud Data Inventory - Cloud

Guide de prise en main de Talend Cloud Data Inventory avec Snowflake

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
task
Gouvernance de données

Voici les concepts principaux de Talend Cloud Data Inventory que vous allez rencontrer en suivant ce scénario :

  • Connection : les connexions sont des environnements ou des systèmes dans lesquels des jeux de données sont stockés, notamment de bases de données, systèmes de fichiers, systèmes ou des plateformes distribués. Les informations de connexion à ces systèmes doivent être configurées une seule fois, car elles sont réutilisables.
  • Dataset (Jeu de données) : les jeux de données sont des collections de données. Ils peuvent être des tables de bases de données, des noms de fichiers, des topics (Kafka), des chemins de fichiers (HDFS), etc. Vous avez également la possibilité de créer des jeux de données de test que vous saisissez manuellement et stockez dans une connexion de test. Il est également possible d'importer des fichiers locaux comme jeux de données. Plusieurs jeux de données peuvent être connectés au même système (connectivité un-à-plusieurs) et sont stockés dans des connexions réutilisables.
  • Sample (Échantillon) : vos données seront visibles sous forme d'échantillon, récupéré des métadonnées du jeu de données.
  • Semantic type (Type sémantique) : le type sémantique d'une colonne ou d'un enregistrement correspond au type de données pouvant être trouvé dans ces colonnes ou enregistrements, comme des noms, des codes postaux, des numéros de téléphone, des coordonnées, etc. Les applications Talend Cloud bénéficient de fonctionnalités sémantiques, ce qui signifie que, lorsque vous regardez vos données d'échantillon, elles sont automatiquement catégorisées à l'aide des types sémantiques par défaut ou à l'aide de ceux que vous avez créés.
  • Talend Trust Score™ : indicateur de qualité globale agrégeant plusieurs métriques en un score unique, compris entre 0 et 5.
  • Tag (Mot-clé) : Vous pouvez appliquer des mots-clés à vos jeux de données comme vous colleriez des post-it. Vous pouvez ainsi ajouter du texte en tant que métadonnées à vos objets Talend Cloud Data Inventory.
  • Custom attributes : attributs personnalisés pouvant être appliqués à vos jeux de données. Ils vous permettent également d'ajouter des informations de métadonnées suivant un ensemble de règles prédéfinies et peuvent être utilisés pour vous permettre de rechercher et trier vos jeux de données.