Profiler Hive - 6.4

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Une fois que vous avez créé la connexion à Hive via la connexion à la distribution Hadoop comme décrit dans Créer une connexion à Hive, vous pouvez analyser les données présentes dans toutes les tables Hive.

Sous le nœud Metadata de la vue DQ Repository, parcourez l'arborescence jusqu'à la connexion à Hive :

  • Cliquez-droit sur la connexion à Hive et sélectionnez Overview Analysis.

    Cette analyse profile le contenu de la base de données afin d'obtenir une vue d'ensemble du nombre de tables et de lignes par table. Pour plus d'informations, consultez Profiling du contenu d'une base de données.

  • Cliquez-droit sur une table Hive et sélectionnez l'une des analyses listées dans le menu.

    Un assistant vous guide à travers les étapes de la création d'analyses de colonnes ou tables. Puis, vous pouvez assigner des indicateurs aux colonnes analysées selon vos besoins.

    Pour plus d'informations, consultez Analyses de colonne(s), Analyses de tables et Analyse de doublons.