Étapes d'utilisation de l'exploration sémantique - 6.1

Talend MDM Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend MDM Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Dans le studio, vous pouvez utiliser la fonctionnalité d'exploration sémantique pour :

  • explore les catégories sémantiques et interroger des relations sémantiques complexes dans les données que vous analysez,

  • créer des analyses de tables préconfigurées avec des indicateurs et modèles convenant aux données.

  • indexer et enrichir le référentiel d'ontologies sur le serveur de log avec des catégories et résultats d'analyses sémantiques.

    Pour plus d'informations concernant les index de dictionnaire et les catégories regex intégrés au studio, consultez l'article de la base de connaissances Dictionary indexes used in the Semantic Discovery analysis (en anglais).

    Pour plus d'informations concernant le contenu du référentiel d'ontologies, consultez l'article de la base de connaissances Accessing semantic concepts stored in the Ontology repository (en anglais).

La séquence d'utilisation de l'exploration sémantique pour créer des analyses de tables préconfigurées comprend les étapes suivantes :

  1. Connexion à une source de données depuis le Studio. La source peut être une base de données, un fichier délimité ou Hive.

    Pour plus d'informations, consultez Avant de commencer à profiler vos données .

  2. Démarrage du serveur de log où sont stockés les index d'ontologies.

    Pour plus d'informations, consultez Démarrer le serveur et configurer les préférences.

  3. Sélection d'une table dans la source de données ou d'une vue dans la connexion à la base de données et exploration des catégories sémantiques des colonnes de données.

    Vous pouvez également choisir de démarrer une analyse d'exploration sémantique sur un ensemble de colonnes dans une table.

    Pour plus d'informations, consultez Explorer les catégories sémantiques des colonnes de données.

  4. Mise en correspondance des métadonnées des colonnes et catégories sémantiques et des concepts dans le référentiel d'ontologies et écriture en sortie des résultats du rapprochement pour afficher les concepts les plus appropriés.

    Pour plus d'informations, consultez Mettre en correspondance les métadonnées des colonnes ainsi que les catégories sémantiques et les concepts dans le référentiel d'ontologies.

  5. Définition des attributs (sémantiques) pour les colonnes et enrichissement du référentiel d'ontologies avec des métadonnées de colonnes et des catégories sémantiques.

    Pour plus d'informations, consultez Enrichir le référentiel d'ontologies.

  6. Exécution de l'analyse de table recommandée et enrichissement du référentiel d'ontologies avec des résultats d'analyses et des indicateurs et modèles utilisés sur les colonnes analysées.

    Pour plus d'informations, consultez Définir l'analyse de table recommandée.