Disponible dans...Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
Après avoir créé une connexion à un cluster ADLS Databricks via Hive, vous pouvez créer une analyse de profiling sur un fichier spécifique.
Procédure
-
Dans la vue DQ Repository, développez la connexion JDBC.
-
Dans le dossier Columns, sélectionnez les colonnes à analyser et cliquez-droit sur celles-ci.
Conseil : Pour créer une analyse sur toutes les colonnes, cliquez-droit sur le nom de la table.
-
Passez votre curseur sur Column Analysis et sélectionnez le type d'analyse.
L'assistant Create New Analysis s'ouvre.
-
Saisissez un nom et cliquez sur Finish. Les autres champs sont facultatifs.
Une nouvelle analyse sur le fichier ADLS sélectionné est automatiquement créée et s'ouvre dans l'éditeur d'analyse. Selon le type d'analyse sélectionné, les indicateurs sont automatiquement attribués aux colonnes.
L'analyse s'applique à la table Hive, mais calcule les statistiques des données depuis ADLS en utilisant le mécanisme External tables. External tables conserve les données du fichier original en dehors de Hive. Si le fichier ADLS que vous avez choisi d'analyser est supprimé, l'analyse ne peut plus s'exécuter.
-
Si nécessaire :
- Modifiez les colonnes à analyser : Dans l'onglet Data Preview, cliquez sur Select Columns.
- Ajoutez plus d'indicateurs ou de nouveaux modèles aux colonnes : Dans l'onglet Analyzed Columns, cliquez sur Select Indicators.
-
Exécutez l'analyse pour afficher les résultats dans la vue Analysis Results de l'éditeur.
Que faire ensuite
Vous pouvez créer un rapport sur cette analyse. Consultez
Créer un rapport sur des analyses spécifiques.