Identifier les anomalies dans les données - 6.5

Guide de prise en main de Talend Open Studio for Data Quality

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Open Studio for Data Quality
task
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Profiling de données
EnrichPlatform
Studio Talend

Ce cas d'utilisation explique comment utiliser la perspective Profiling du studio pour analyser les adresses e-mail et les numéros de téléphone des clients. Il utilise des indicateurs et des modèles prêts à l'emploi sur les colonnes et montre les données d'adresse correspondantes et ne correspondant pas.

Vous pouvez utiliser la perspective Data Explorer pour parcourir les données ne correspondant pas.

La séquence de profiling des données clients comprend les étapes suivantes :

Procédure

  1. Création d'une analyse de colonnes sur les adresses e-mail et les numéros de téléphone des clients. Pour plus d'informations, consultez Définir une analyse de colonnes.
  2. Connexion à la base de données comprenant les données clients dans l'éditeur d'analyse. Pour plus d'informations, consultez Créer une connexion à la base de données.
  3. Ajout d'indicateurs fournissant des statistiques simples sur les données comme le nombre de lignes, de valeurs blanches et de valeurs en doublon. Pour plus d'informations, consultez Configurer des indicateurs système.
  4. Ajout de modèles standard par rapport auxquels les adresses e-mail et les numéros de téléphone correspondent. Pour plus d'informations, consultez Configurer des modèles.
  5. Exécution de l'analyse afin que les résultats s'affichent dans les tables et les graphiques. Pour plus d'informations, consultez Afficher les résultats d'analyse.
  6. Accès à une vue des données analysées pour consulter les enregistrements invalides. Pour plus d'informations, consultez Explorer les données ne correspondant pas.