Utiliser les notifications et les logs afin de remarquer et corriger des erreurs dans un pipeline dont l'exécution a échoué.
Procédure
-
Ouvrez le pipeline dont l'exécution a échoué.
Ici, ce pipeline contient une table d'une base de données concernant des client·es, un processeur Python 3 qui concatène des noms, convertit des devises et traite des dates, ainsi qu'un topic HDFS permettant de stocker les données traitées.
-
Pour afficher le message d'erreur vous informant du statut d'exécution, cliquez sur l'icône dans la barre d'outils en haut.
Dans cette fenêtre, vous pouvez développer le message d'erreur en cliquant sur ce dernier.
-
Pour obtenir des informations plus détaillées et catégorisées au sujet de cette erreur, cliquez sur le lien View Logs (Voir les logs) dans la fenêtre Notification, ou allez dans l'onglet Metrics (Métriques) du panneau Pipeline Details (Détails du pipeline) et cliquez sur le bouton View Logs (Voir les logs).
Par défaut, tous les logs sont affichés.
-
Pour trier les logs et lire uniquement les messages d'erreur, cochez la case Error.
Vous pouvez voir que l'erreur est liée à un opérateur incorrect utilisé dans le processeur Python 3 à la ligne 7.
-
Maintenant que l'erreur est repérée, sélectionnez le processeur Python 3 afin de modifier sa configuration.
À la ligne 7, l'année 2017 est entourée d'opérateurs inutiles causant l'échec du pipeline. Modifiez la ligne comme suit :output['number_year_registrated'] = 2017 - int(year)
et sauvegardez vos modifications.
-
Cliquez sur l'icône d'exécution dans la barre d'outils en haut pour exécuter à nouveau votre pipeline.
Résultats
Le pipeline est réparé et exécuté avec succès. Si vous avez raté une notification vous informant du succès de l'exécution, cliquez sur l'icône
dans la barre d'outils en haut, afin de l'afficher.