Définition d'un lignage de données avec Cloudera Navigator
Si vous utilisez Cloudera V5.5+ pour exécuter vos Jobs MapReduce ou vos Jobs Apache Spark Batch, vous pouvez utiliser Cloudera Navigator pour visualiser le lignage d'un flux de données en particulier pour découvrir comment ces données sont générées par un Job.
Le lignage comprend tous les composants utilisés dans ce Job et les modifications du schéma entre les composants.
Ce type de Job est disponible lorsque vous avez souscrit à l'un des produits Talend avec Big Data ou à Talend Data Fabric.
Procédure
Lorsque cette option est activée, vous devez configurer les paramètres suivants :
Résultats
Lorsque vous exécutez ce Job, le lignage est automatiquement généré dans Cloudera Navigator.
Une fois l'exécution du Job terminé, effectuez une recherche dans Cloudera Navigator pour chercher les données écrites par ce Job et voir le lignage de ces données dans Cloudera Navigator.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !