Exécuter un Job dans Talend Administration Center - 7.0

Guide de prise en main de Talend Real-Time Big Data Platform

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
EnrichPlatform
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime

Dans la page Job Conductor de Talend Administration Center, vous définissez une tâche d'exécution pour regrouper les phases de génération de script, de déploiement et d'exécution de vos Jobs MapReduce et Spark Batch.

Avant de commencer

  • Vérifié que la machine cliente sur laquelle les Jobs Talendsont exécutés peut reconnaître les noms d'hôtes des nœuds du cluster Hadoop à utiliser. Dans cet objectif, ajoutez les mappings des entrées adresse IP/nom d'hôte pour les services de ce cluster Hadoop dans le fichier hosts de la machine cliente.

    Dans ce cas d'utilisation, cette machine est celle sur laquelle Talend Runtime est installé.

  • Le cluster Hadoop à utiliser a été correctement configuré et est en cours de fonctionnement.

  • l'administrateur du cluster doit avoir donné les droits d'accès en lecture/écriture à l'utilisateur accédant aux données et répertoires dans HDFS.

  • Vous avez créé les Jobs de cas d'utilisation décrits dans les sections précédentes et les avez exécutés avec succès depuis le Studio.

Procédure

  1. Connectez-vous à Talend Administration Center avec le compte que vous avez créé dans Configurer votre premier utilisateur et premier projet.
  2. Dans la vue Menu de Talend Administration Center, cliquez sur Job Conductor pour afficher la page Job Conductor.
  3. Dans la barre d'outils de la page Job Conductor, cliquez sur Add > Normal Task de la barre d'outils pour afficher le formulaire Execution task.
  4. Dans le champ Label, saisissez le nom que vous souhaitez donner à la tâche à déclencher. Par exemple, getting_started.
  5. Cliquez sur l'icône pour ouvrir un filtre de Job afin de chercher le Job à exécuter depuis le Job Conductor et sélectionnez-le dans le filtre en utilisant sa dernière version (Latest).

    Par exemple, ce Job peut être le Job MapReduce décrit dans Fusionner les informations relatives aux films et aux réalisateurs à l'aide d'un Job MapReduce.

    Une fois que vous avez sélectionné le Job, les champs Project, Branch, Name, Version et Context sont automatiquement complétés par les informations relatives au Job sélectionné.

  6. Cochez la case Regenerate Job on change pour regénérer le Job sélectionné avant le déploiement et l'exécution de la tâche chaque fois qu'une modification est effectuée sur le Job.

    Notez que si vous avez sélectionné la dernière version du Job (Latest version), lorsqu'une nouvelle version du Job est créée dans le Studio, ce Job sera regénéré même si vous n'avez pas coché l'option Regenerate Job on change.

  7. Sélectionnez le serveur sur lequel déployer votre tâche.

    Dans ce scénario, le serveur est le service Talend Runtime que vous avez configuré dans Connexion du Conteneur de Talend Runtime à Talend Administration Center.

  8. Cliquez sur Save pour valider la configuration.

    La nouvelle tâche est ajoutée à la liste des tâches.

  9. Dans la page Job Conductor, cliquez sur la tâche getting_started pour la sélectionner et dans la barre d'outils, cliquez sur Generate pour permettre à la tâche de rechercher le script de Job approprié dans le projet approprié depuis le Repository du Studio Talend et de générer le code.

    Une fois la génération terminée, le statut de la tâche indique Ready to deploy (prêt à déployer), ce qui signifie que le code généré est maintenant prêt à être déployé sur le serveur d'exécution.

  10. Cliquez sur Deploy pour déployer le Job sur le serveur d'exécution.

    Une fois le déploiement terminé, le statut indique Ready to run (prêt à être exécuté). Cela signifie que le serveur a bien reçu le Job et est maintenant prêt à l'exécuter.

  11. Cliquez sur Run pour exécuter le Job.

    Une fois l'exécution terminée, le statut indique de nouveau Ready to run (prêt à être exécuté), ce qui signifie que le Job peut être de nouveau exécuté si nécessaire.

    Vérifiez la colonne Error Status si la tâche ne s'est pas exécutée correctement, ainsi que le log de la tâche pour les informations sur l'exécution du Job.

    Cela fait, vous pouvez vérifier, par exemple, dans la console Web de votre système HDFS, que la sortie a bien été écrite dans HDFS.