Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
Procédure
- Développez DB connections.
-
Dans la base de données de votre choix, parcourez l'arborescence jusqu'aux colonnes à analyser, sélectionnez-les et cliquez sur Finish pour fermer l'assistant.
Dans cet exemple, vous souhaitez analyser un ensemble de six colonnes dans la table customer : numéro de compte (account_num), scolarité (education), e-mail (email), prénom (fname), nom de famille (Iname) et sexe (gender). Les statistiques présentées dans les résultats d'analyse sont le nombre de lignes, de valeurs distinctes, de valeurs uniques et de valeurs en doublon s'appliquant sur tous les enregistrements (valeurs d'un ensemble de colonnes).Un dossier pour l'analyse nouvellement créée s'affiche sous le nœud Analyses dans la vue DQ Repository et l'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse.
Dans cet exemple, vous souhaitez analyser un ensemble de six colonnes dans la table customer : numéro de compte (account_num), études (education), e-mail (email), prénom (fname), nom de famille (Iname) et genre (gender). Les statistiques présentées dans les résultats d'analyse sont le nombre de lignes, de valeurs distinctes, de valeurs uniques et de valeurs en doublon s'appliquant sur tous les enregistrements (valeurs d'un ensemble de colonnes).
-
Dans la zone Data preview, sélectionnez :
Option Pour... New Connection (Nouvelle connexion) ouvrir un assistant et créer ou modifier la connexion à la source de données depuis l'éditeur. Le champ Connection en haut de cette zone liste toutes les connexions créées dans le Studio.
Select Columns ouvrir la boîte de dialogue Column Selection dans laquelle vous pouvez sélectionner les colonnes à analyser ou modifier la sélection des colonnes listées dans la table. Dans la boîte de dialogue ouverte, vous pouvez filtrer la liste des tables ou des colonnes à l'aide des champs Table filter et Column filter, respectivement.
n first rows ou n random rows lister dans la table les N premiers enregistrements de données des colonnes sélectionnées ou lister N enregistrements aléatoires des colonnes sélectionnées. Refresh Data (Actualiser les données) afficher les données dans les colonnes sélectionnées selon les critères définis. Run with sample data exécuter l'analyse uniquement sur le jeu de données d'exemple, dans le champ Limit. - Dans le champ Limit, configurez le nombre d'enregistrements de données que vous souhaitez afficher dans la table et utiliser comme données d'exemple.