Pourquoi profiler vos données - 6.3

Talend Big Data Platform Studio Guide utilisateur

EnrichVersion
6.3
EnrichProdName
Talend Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le profiling de données est le processus permettant d'examiner les données disponibles dans différentes sources de données et de collecter des statistiques et des informations concernant ces données. Le profiling de données permet d'évaluer le niveau de qualité des données, selon un ensemble d'objectifs définis.

Les problèmes de qualité de données peuvent provenir de différentes sources, comme les systèmes hérités, les migrations de données, les modifications apportées aux bases de données, les incohérences dans la communication humaine, et de nombreuses autres anomalies potentielles. Quelle que soit la source, les problèmes de qualité de données peuvent avoir un impact sur les capacités des entreprises à utiliser leurs données pour prendre des décisions éclairées.

Une image claire et honnête de tous les problèmes potentiels est nécessaire pour planifier des projets efficacement. Les besoins de l'analyse, du nettoyage et de la transformation des données doivent être compris avant la finalisation des coûts et du plan d'exécution, et non après.

Comparé aux techniques manuelles d'analyse, la technologie du profiling de données améliore les capacités de l'entreprise à relever le défi que représente la gestion de la qualité de données, et à faire face à la qualité de données lors des processus de migration et d'intégration de données.