Accéder au contenu principal Passer au contenu complémentaire

Profiling de données et qualité de données

Qu'est-ce que le Talend Data Quality ?

Votre Studio Talend est une solution complète de qualité et de gestion de données comprenant différents éléments principaux :
  • Les perspectives Profiling et Data Explorer dans lesquelles vous pouvez analyser des données, parcourir et interroger les résultats des analyses.
  • La perspective Integration dans laquelle vous pouvez accéder à un ensemble de composants et routines dédiés à la qualité de données. Cela vous permet d'embarquer des fonctionnalités de nettoyage de données dans vos processus de transformation/intégration de données.
  • Dans la perspective Integration, vous avez accès à des centaines de composants couvrant tous les besoins en intégration de données, ainsi que de nombreux composants de qualité de données utilisés pour nettoyer les données.

Pour plus d'informations concernant ces composants spécifiques à la qualité de données, consultez Composants de qualité de données (Data Quality).

Cette fonctionnalité n'est pas intégrée par défaut dans votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Fonctions de base

Référentiel des métadonnées

À l'aide de la solution de qualité de données Talend, vous pouvez vous connecter à des sources de données pour analyser leur structure (catalogues, schémas et tables) et stocker la description de leurs métadonnées dans son référentiel de métadonnées. Vous pouvez utiliser ces métadonnées pour définir des métriques et des indicateurs.

Pour plus d'informations, consultez Créer des connexions aux différentes sources de données.

Une fonction intéressante est la base de données de rapports, dans laquelle vous pouvez garder un historique des rapports créés et partager les résultats avec les membres de votre équipe. Pour plus d'informations, consultez Gestion de la base de données de rapports.

Modèles et indicateurs

Les modèles sont des ensembles de chaînes de caractères par rapport auxquels vous pouvez définir le contenu, la structure et la qualité de données hautement complexes. La perspective Profiling du Studio Talend liste deux types de modèles :
  • Les expressions régulières, qui sont des modèles réguliers prédéfinis.
  • Les modèles SQL qui sont les modèles que vous ajoutez à l'aide de clauses LIKE.

    Pour plus d'informations concernant les modèles, consultez Modèles.

Les indicateurs sont les résultats de l'implémentation de différents modèles. Ils peuvent représenter les résultats de correspondance des données et de différentes autres opérations liées aux données. La perspective Profiling du Studio Talend liste deux types d'indicateurs :
  • les indicateurs système, la liste d'indicateurs prédéfinis,
  • les indicateurs personnalisés, la liste des indicateurs définis par l'utilisateur·trice.

    Pour plus d'informations concernant les indicateurs, consultez Indicateurs.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.