Profiler Hive - 7.0

Guide utilisateur de Talend Data Management Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Management Platform
task
Création et développement
EnrichPlatform
Studio Talend

Une fois que vous avez créé la connexion à Hive via la connexion à la distribution Hadoop comme décrit dans Créer une connexion à Hive, vous pouvez analyser les données présentes dans toutes les tables Hive.

Sous le nœud Metadata de la vue DQ Repository, parcourez l'arborescence jusqu'à la connexion à Hive :

  • Cliquez-droit sur la connexion à Hive et sélectionnez Overview Analysis.

    Cette analyse profile le contenu de la base de données afin d'obtenir une vue d'ensemble du nombre de tables et de lignes par table. Pour plus d'informations, consultez Analyses de bases de données.

  • Cliquez-droit sur une table Hive et sélectionnez l'une des analyses listées dans le menu.

    Un assistant vous guide à travers les étapes de la création d'analyses de colonnes ou tables. Puis, vous pouvez assigner des indicateurs aux colonnes analysées selon vos besoins.

    Pour plus d'informations, consultez Par quoi commencer ?, Les étapes de l'analyse de tables de base de données et Analyse de doublons.