Identifier les anomalies dans les données - 7.3

Guide de prise en main de Talend MDM Platform

Version
7.3
Language
Français
Operating system
MDM Platform
Product
Talend MDM Platform
Module
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend MDM Server
Talend MDM Web UI
Talend Runtime
Content
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
Last publication date
2023-07-24

Ce cas d'utilisation explique comment utiliser la perspective Profiling du Studio pour analyser les adresses e-mail et les numéros de téléphone des clients. Il utilise des indicateurs et des modèles prêts à l'emploi sur les colonnes et montre les données d'adresse correspondantes et ne correspondant pas.

Les Jobs Profiling sont ensuite générés dans les résultats d'analyse afin de nettoyer les données clients et monitorer leur évolution.

Vous pouvez utiliser la perspective Data Explorer pour parcourir les données ne correspondant pas.

La séquence de profiling et de nettoyage des données clients comprend les étapes suivantes :

Procédure

  1. Création d'une analyse de colonnes sur les adresses e-mail et les numéros de téléphone des clients.
  2. Connexion à la base de données comprenant les données clients dans l'éditeur d'analyse.
  3. Ajout d'indicateurs fournissant des statistiques simples sur les données comme le nombre de lignes, de valeurs vides et de valeurs en doublon.
  4. Ajout de modèles standard d'adresses e-mail et de numéros de téléphone pour l'analyse de correspondance.
  5. Exécution de l'analyse afin que les résultats s'affichent dans les tables et les graphiques.
  6. Accès à une vue des données analysées pour consulter les enregistrements invalides.
  7. Génération de Jobs prêts à l'emploi à partir des résultats d'analyse pour supprimer les valeurs en doublon des colonnes Email et Phone.
  8. Génération de Jobs prêts à l'emploi à partir des résultats d'analyse pour supprimer les valeurs qui ne respectent pas le format d'e-mail ou de numéro de téléphone standard, respectivement des colonnes Email et Phone.