Sélectionner les colonnes à analyser et configurer les paramètres d'analyse - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Procédure

  1. Dans l'éditeur d'analyse et dans la liste Connection, sélectionnez la connexion à la base de données sur laquelle exécuter l'analyse.
    Les analyses de corrélations nominales sont disponibles uniquement pour les colonnes des bases de données. Vous pouvez modifier votre connexion à votre base de données en sélectionnant une autre base dans la liste Connection. Si les colonnes analysées n'existent pas dans la nouvelle connexion à la base de données que vous souhaitez définir, vous recevrez un message d'avertissement vous permettant de continuer et d'annuler l'opération
  2. Cliquez sur Select Columns pour ouvrir la boîte de dialogue [Column Selection].
  3. Parcourez les catalogues/schémas de votre connexion à la base de données jusqu'aux colonnes à analyser.
    Vous pouvez filtrer la liste des tables ou des colonnes en saisissant le texte souhaité dans les champs Table filter ou Column filter respectivement. La liste affiche uniquement les tables/colonnes correspondant au texte saisi.
  4. Cliquez sur le nom de la table pour afficher toutes ses colonnes dans le panneau de droite de la boîte de dialogue [Column Selection].
  5. Dans la liste des colonnes, cochez la case des colonnes que vous souhaitez analyser, puis cliquez sur OK.
    Dans cet exemple, l'objectif est de calculer l'âge moyen du personnel de plusieurs entreprises situées dans différents états. Les colonnes à analyser sont AGE, COMPANY et STATE.
    Vous pouvez glisser les colonnes à analyser directement à partir de la connexion à la base de données correspondante de la vue DQ Repository dans la zone Analyzed Columns.
    Si vous cliquez-droit sur une colonne listée dans la vue Analyzed Columns et que vous sélectionnez Show in DQ Repository view, la colonne sélectionnée sera automatiquement située sous la connexion correspondante dans l'arborescence.
    Les colonnes sélectionnées sont affichées dans la section Analyzed Columns (Colonnes analysées) de l'éditeur.
  6. In the Indicators view, click Options icon to open a dialog box where you can set thresholds for each indicator.
    Vue d'ensemble de la boîte de dialogue Indicator (Indicateur).
    Les indicateurs représentant les statistiques simples sont par défaut attachés à ce type d'analyse.
  7. Dans la vue Data Filter, saisissez une clause WHERE SQL pour filtrer les données sur lesquelles exécuter l'analyse, si nécessaire.
  8. Dans la vue Analysis Parameter et dans le champ Number of connections per analysis, configurez le nombre de connexions concourantes autorisées pour la connexion à la base de données sélectionnée si besoin.
    Vous pouvez configurer ce nombre selon les ressources disponibles de la base de données, c'est-à-dire le nombre de connexions concourantes que chaque base de données peut supporter.
  9. Si vous avez défini des variables de contexte dans la vue Context (Contexte) de l'éditeur d'analyse, effectuez la procédure suivante :
    1. Utilisez les vues Data Filter et Analysis Parameter pour configurer/sélectionner des variables de contexte afin de filtrer les données et décider du nombre de connexions simultanées par analyse, respectivement.
    2. Dans la vue Context Settings (Paramètres de contexte), sélectionnez dans la liste l'environnement de contexte à utiliser pour exécuter l'analyse.
    Pour plus d'informations concernant les contextes et les variables, consultez Utilisation des variables de contexte dans les analyses.
  10. Appuyez sur F6 pour exécuter l'analyse.

Résultats

L'éditeur passe à la vue Analysis Results (Résultats de l'analyse pour afficher les résultats.
Résultat graphique de la moyenne d'âge par rapport au nombre total.

Pour plus d'informations concernant les résultats d'analyse, consultez Explorer les résultats de l'analyse de corrélation numérique.