Ontologies utilisées dans le Studio - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Qu'est-ce qu'une ontologie ?

Une ontologie est une description des concepts, attributs et des relations pouvant exister pour des données dans différentes colonnes. Par exemple, une colonne customer (client) est le concept et date of birth (date de naissance) et name (nom) sont les attributs de ce concept. Une ontologie liste les concepts, les attributs et les synonymes des attributs.

À quoi sert une ontologie dans le Studio ?

L'utilisation du référentiel d'ontologies stocké sur le serveur de log avec le Studio permet le partage des connaissances via la réutilisation des indicateurs et modèles précédemment analysés et correspondant au mieux au type de données que vous analysez.

Le Studio Talend analyse le contenu de colonnes à partir d'un ensemble de méthodes (regex, data dictionary et keyword dictionary) puis décide de la catégorie à laquelle appartiennent les données. Par exemple, pour des données comme les suivantes :

  • user@talend.com, le Studio Talend l'analyse par rapport à une regex et détermine que c'est une adresse e-mail (EMAILADDRESS),
  • John, le Studio Talend l'analyse par rapport au dictionnaire de données et détermine que c'est un prénom (FIRSTNAME),
  • 43 Chester Road, le Studio Talend analyse les jetons dans la chaîne de caractères par rapport aux mots-clés dans le dictionnaire et déterminer que Road est une adresse (ADDRESSLINE).

Quelles sont les ontologies utilisées dans le Studio ?

Une ontologie a été construite sur le serveur de log en fusionnant différents standards : UBL et OAGI :

  • Universal Business Language (UBL) : une initiative OASIS pour créer une synthèse des bibliothèques XML existantes en un langage universel.
  • Open Application Group (OAGI) : OAGI définit un modèle de contenu commun ainsi que des messages communs pour la communication enter les applications métier.

Le résultat final de cette fusion consiste en 412 concepts s'appliquant à différents domaines, notamment : les clients, l'entreprise, la géographie, les produits, la finance, etc.