Identifier les anomalies dans les données - 6.3

Talend Open Studio for Data Quality Guide de prise en main

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Data Quality
task
Installation et mise à niveau
Qualité et préparation de données
EnrichPlatform
Studio Talend

Cette analyse profile les adresses e-mail et les numéros de téléphone des clients basés aux États-Unis. Elle montre comment identifier des anomalies dans les colonnes adress.

Ce cas d'utilisation explique comment utiliser la perspective Profiling du studio pour analyser les adresses e-mail et les numéros de téléphone des clients. Il utilise des indicateurs et des modèles prêts à l'emploi sur les colonnes et montre les données d'adresse correspondantes et ne correspondant pas.

Vous pouvez utiliser la perspective Data Explorer pour parcourir les données ne correspondant pas.

La séquence de profiling des données clients comprend les étapes suivantes :

  1. Création d'une analyse de colonnes sur les adresses e-mail et les numéros de téléphone des clients. Pour plus d'informations, consultez Définir une analyse de colonnes.

  2. Connexion à la base de données comprenant les données clients dans l'éditeur d'analyse. Pour plus d'informations, consultez Créer une connexion à la base de données.

  3. Ajout d'indicateurs fournissant des statistiques simples sur les données comme le nombre de lignes, de valeurs blanches et de valeurs en doublon. Pour plus d'informations, consultez Configurer des indicateurs système.

  4. Ajout de modèles standard par rapport auxquels les adresses e-mail et les numéros de téléphone correspondent. Pour plus d'informations, consultez Configurer des modèles.

  5. Exécution de l'analyse afin que les résultats s'affichent dans les tables et les graphiques. Pour plus d'informations, consultez Afficher les résultats d'analyse.

  6. Accès à une vue des données analysées pour consulter les enregistrements invalides. Pour plus d'informations, consultez Explorer les données ne correspondant pas.