Accéder au contenu principal Passer au contenu complémentaire

Créer une analyse de corrélation nominale

Avant de commencer

Une connexion à une base de données doit avoir été créée dans la perspective Profiling .

Pourquoi et quand exécuter cette tâche

Dans l'exemple ci-dessous, l'objectif est de créer une analyse de corrélation nominale afin de calculer les dates de naissance minimale et maximale pour chaque pays listé dans la colonne nominale sélectionnée. Deux colonnes sont utilisées pour l'analyse : date de naissance et pays.
Note InformationsRestriction : Les analyses de corrélation nominale sont possibles uniquement sur des colonnes de bases de données. Vous ne pouvez utiliser cette analyse sur des connexions aux fichiers.

Définir l'analyse de corrélation nominale

Procedure

  1. Dans la vue DQ Repository, développez le dossier Data Profiling.
  2. Cliquez-droit sur le dossier Analyses et sélectionnez New Analysis.
    Menu contextuel du nœud Analyses.
    L'assistant Create New Analysis s'ouvre.
  3. Commencez à saisir nominal correlation analysis dans le champ de filtre, sélectionnez Nominal Correlation Analysis puis cliquez sur Next.
  4. Dans le champ Name, saisissez un nom pour l'analyse.
    Note InformationsImportant:

    N'utilisez pas les caractères spéciaux suivants dans le nom des éléments : ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " « » < >

    Ces caractères seront remplacés par un "_" dans le système de fichiers et vous risquez de créer des doublons.

  5. Définissez les métadonnées de l'analyse (Purpose (Objectif), Description et Author (Auteur)) dans les champs correspondants puis cliquez sur Finish.
    Un dossier pour la nouvelle analyse créée s'affiche dans le dossier Analysis, dans la vue DQ Repository et l'éditeur d'analyse s'ouvre sur les métadonnées de l'analyse.

Sélectionner les colonnes à analyser

Procedure

  1. Dans l'éditeur d'analyse et dans la liste Connection, sélectionnez la connexion à la base de données sur laquelle exécuter l'analyse.
    Les analyses de corrélations nominales sont possibles uniquement sur les colonnes de base de données. Vous pouvez modifier votre connexion à votre base de données en sélectionnant une autre base dans la liste Connection. Si les colonnes analysées n'existent pas dans la nouvelle connexion à la base de données que vous souhaitez définir, vous recevrez un message d'avertissement vous permettant de continuer et d'annuler l'opération
  2. Cliquez sur Select Columns afin d'ouvrir la boîte de dialogue [Column Selection] et sélectionnez les colonnes que vous souhaitez analyser, ou glissez-les directement à partir de la vue DQ Repository.
    Si vous sélectionnez trop de colonnes, le graphique des résultats de l'analyse sera très difficile à lire.
    Si vous cliquez-droit sur une colonne listée dans la vue Analyzed Columns et que vous sélectionnez Show in DQ Repository view, la colonne sélectionnée sera automatiquement située sous la connexion correspondante dans l'arborescence.
  3. Cliquez sur Options dans la vue Indicators (Indicateurs) pour ouvrir une boîte de dialogue dans laquelle vous pouvez configurer les seuils pour chaque indicateur.
    Les indicateurs représentant les statistiques simples sont par défaut attachés à ce type d'analyse.
  4. Dans la vue Data Filter, saisissez une clause WHERE SQL pour filtrer les données sur lesquelles exécuter l'analyse, si nécessaire.
  5. Dans la vue Analysis Parameter et dans le champ Number of connections per analysis, configurez le nombre de connexions concourantes autorisées pour la connexion à la base de données sélectionnée si besoin.
    Vous pouvez configurer ce nombre selon les ressources disponibles de la base de données, c'est-à-dire le nombre de connexions concourantes que chaque base de données peut supporter.
  6. Si vous avez défini des variables de contexte dans la vue Contexts de l'éditeur d'analyse :
    1. utilisez les vues Data Filter et Analysis Parameter pour configurer/sélectionner des variables de contexte afin de filtrer les données et décider du nombre de connexions concourantes par analyse, respectivement.
    2. Dans la vue Context Settings (Paramètres de contexte), sélectionnez dans la liste l'environnement de contexte à utiliser pour exécuter l'analyse.
    Pour plus d'informations concernant les contextes et les variables, consultez Utilisation des variables de contexte dans les analyses.
  7. Appuyez sur F6 pour exécuter l'analyse.
    L'éditeur passe à la vue Analysis Results (Résultats de l'analyse pour afficher les résultats.
    Pour des explications détaillées des résultats d'analyse, consultez Explorer les résultats de l'analyse de corrélation nominale.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.