Lignage des données - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Le lignage des données montre le flux de données à partir de la destination de celles-ci (composant de sortie), en passant par les différents composants et étapes, jusqu'à la source des données (composant d'entrée). Les résultats du lignage des données tracent le cycle du flux de données entre les différents composants, et incluent les opérations réalisées sur les données.

Studio Talend Le vous permet aussi de générer une documentation détaillée des résultats du processus de lignage de données au format HTML. Pour plus d'informations, consultez Exporter les résultats de l'analyse d'impact/du lignage de données au format HTML et Exporter les résultats de l'analyse d'impact/du lignage de données au format XML.

Avertissement : Tous les éléments sur lesquels vous voulez réaliser une analyse d'impact ou un lignage de données doivent être centralisés dans la vue du Repository sous les nœuds suivants : Joblets Designs, Contexts, SQL Templates, Referenced project ou Metadata.

L'exemple ci-dessous montre le lignage de données opéré sur un élément de connexion à la base de données enregistré sous le nœud Metadata dans la vue Repository.

Pour lancer un lignage de données sur un élément de la base de données, procédez comme suit :

Procédure

  1. Dans la vue du Repository, développez le nœud Metadata > Db Connection. Ensuite, développez la connexion à la base de données que vous souhaitez analyser, mysql dans cet exemple.
  2. Cliquez-droit sur le schéma centralisé de la table sur lequel vous souhaitez analyser le cycle du flux de données, employees dans cet exemple.
    La vue Impact Analysis affiche le ou les Job(s) listé(s) utilisant le schéma de la table sélectionnée. Les noms des connexions à la base de données et les tables sélectionnés s'affichent par défaut dans les champs correspondants.
  3. Dans la liste Column, sélectionnez le nom de la colonne dans laquelle vous voulez analyser le flux de données, à partir de la destination des données (composant de sortie), en passant par les différents composants et étapes, jusqu'à la source des données (composant d'entrée). La colonne à analyser dans cet exemple est la colonne Name.
    Vous pouvez passer cette étape en cliquant droit sur la colonne Name de la vue Repository et en sélectionnant Impact Analysis dans le menu contextuel.
  4. Cliquez sur Data Lineage.
    Une barre de progression s'affiche pour montrer l'avancée du processus d'analyse.
  5. Cliquez-droit sur le Job listé et sélectionnez Open Job dans le menu contextuel.
    Le Job s'ouvre dans l'espace de modélisation graphique.
    Les résultats du lignage de données affichent les composants et les transformations par lesquels sont passées les données, avant d'être inscrits dans la colonne de sortie name.