Identifier les anomalies dans les données - 7.0

Guide de prise en main de Talend MDM Platform

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend MDM Platform
task
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
EnrichPlatform
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend MDM Server
Talend MDM Web UI
Talend Runtime

Ce cas d'utilisation explique comment utiliser la perspective Profiling du Studio pour analyser les adresses e-mail et les numéros de téléphone des clients. Il utilise des indicateurs et des modèles prêts à l'emploi sur les colonnes et montre les données d'adresse correspondantes et ne correspondant pas.

Les Jobs Profiling sont ensuite générés dans les résultats d'analyse afin de nettoyer les données clients et monitorer leur évolution.

Vous pouvez utiliser la perspective Data Explorer pour parcourir les données ne correspondant pas.

La séquence de profiling et de nettoyage des données clients comprend les étapes suivantes :

Procédure

  1. Création d'une analyse de colonnes sur les adresses e-mail et les numéros de téléphone des clients. Pour plus d'informations, consultez Définir une analyse de colonnes.
  2. Connexion à la base de données comprenant les données clients dans l'éditeur d'analyse. Pour plus d'informations, consultez Créer une connexion à la base de données.
  3. Ajout d'indicateurs fournissant des statistiques simples sur les données comme le nombre de lignes, de valeurs blanches et de valeurs en doublon. Pour plus d'informations, consultez Configurer des indicateurs système.
  4. Ajout de modèles standard par rapport auxquels les adresses e-mail et les numéros de téléphone correspondent. Pour plus d'informations, consultez Configurer des modèles.
  5. Exécution de l'analyse afin que les résultats s'affichent dans les tables et les graphiques. Pour plus d'informations, consultez Afficher les résultats d'analyse.
  6. Accès à une vue des données analysées pour consulter les enregistrements invalides. Pour plus d'informations, consultez Explorer les données ne correspondant pas.
  7. Génération de Jobs prêts à l'emploi à partir des résultats d'analyse pour supprimer les valeurs en doublon des colonnes Email et Phone. Pour plus d'informations, consultez Supprimer les valeurs en doublon.
  8. Génération de Jobs prêts à l'emploi à partir des résultats d'analyse pour supprimer les valeurs qui ne respectent pas le format d'e-mail ou de numéro de téléphone standard, respectivement des colonnes Email et Phone. Pour plus d'informations, consultez Supprimer les valeurs ne correspondant pas.