Principes de travail de la qualité de données - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Depuis la perspective Profiling du studio, vous pouvez examiner les données disponibles dans différentes sources de données et collecter les statistiques et les informations concernant ces données.

Une séquence typique de profiling de données via le studio comprend les étapes suivantes :

Procédure

  1. Connexion à une source de données, comme une base de données ou un fichier délimité afin d'accéder aux tables et colonnes sur lesquelles vous souhaitez définir et exécuter les analyses. Pour plus d'informations, consultez Créer des connexions aux différentes sources de données.
  2. Définition de toutes les analyses de qualité de données disponibles, comme les analyses de contenu d'une base de données, les analyses de colonnes, les analyses de tables, les analyses de redondance, les analyses de corrélation, etc. Définition de toutes les analyses de qualité de données disponibles, comme les analyses de contenu d'une base de données, les analyses de colonnes, les analyses de tables, les analyses de redondance, les analyses de corrélation, etc. Ces analyses exécuteront des processus de profiling de données qui définiront le contenu, la structure et la qualité de données aux structures hautement complexes. Les résultats de l'analyse seront affichés graphiquement à côté de chaque éditeur d'analyse, ou plus en détails dans la vue Analysis Results.
    Remarque : En revanche, vous pouvez utiliser uniquement les analyses Column Analysis et Column Set Analysis pour profiler des données dans un fichier délimité.
  3. Génération de rapports à partir des différentes analyses, et historisation des rapports dans une base de données distante. Ces rapports vous permettent de comparer les statistiques actuelles et historiques afin de déterminer s'il y a eu dégradation ou amélioration des données. Pour plus d'informations, consultez Les rapports.
  4. Accès aux différents outils analytiques qui vous permettront d'explorer et de monitorer les rapports générés dans le studio. Pour plus d'informations concernant le portail, consultez le Guide utilisateur et administrateur deTalend DQ Portal. Pour plus d'informations concernant l'installation du Portail, consultez le Guide d'installation et de migration Talend.

Résultats

Votre studio fournit différents modes de verrouillage vous permettant, si vous êtes le premier utilisateur à ouvrir un élément, de verrouiller cet élément et de posséder les droits de lecture-écriture. Les autres utilisateurs qui ouvrent simultanément le même élément n'ont qu'un accès en lecture seule. Pour plus d'informations, consultez Principe de verrouillage.