Définir les détails de la connexion HDFS dans la vue Oozie scheduler (déprécié) - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Disponible dans...

Big Data

Big Data Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Data Fabric

Real-Time Big Data Platform

Le support d'Oozie dans le Studio est déprécié à partir de la version 7.2 de Talend.

Utilisez Talend Administration Center pour démarrer, monitorer et ordonnancer les exécutions de vos Jobs Big Data.

Procédure

  1. Cliquez sur la vue Oozie scheduler en bas de l'espace de modélisation graphique.

    Exemple

  2. Cliquez sur Setting pour ouvrir la boîte de dialogue de la connexion.

    Exemple

  3. Configurez la connexion à Oozie.
    • Si vous avez configuré la connexion à Oozie dans le Repository, comme expliqué dans Centraliser une connexion Oozie (déprécié), vous pouvez la réutiliser. Pour ce faire, sélectionnez Repository dans la liste Property type, cliquez sur le bouton [...] pour ouvrir la boîte de dialogue Repository Content et sélectionnez la connexion à Oozie à utiliser.

    • Si vous n'avez pas configuré la connexion à Oozie dans le référentiel, renseignez les informations dans les champs correspondants, comme expliqué dans le tableau ci-dessous.

      Champ/Option Description

      Hadoop distribution

      Distribution Hadoop à laquelle vous connecter. Cette distribution héberge le système de fichiers HDFS à utiliser. Si vous sélectionnez Custom pour vous connecter à une distribution Hadoop personnalisée, cliquez sur le bouton [...] pour ouvrir la boîte de dialogue [Import custom definition]. Dans cette boîte de dialogue, importez les fichiers Jar requis par la distribution personnalisée.

      Pour plus d'informations, consultez la Connexion à une distribution Hadoop personnalisée.

      Hadoop version

      Version de la distribution Hadoop à laquelle vous connecter. Cette liste disparaît si vous sélectionnez Custom dans la liste Hadoop distribution.

      Enable kerberos security

      Si vous accédez au cluster Hadoop fonctionnant avec la sécurité Kerberos, cochez cette case, puis saisissez le Principal Name de Kerberos pour le NameNode dans le champ affiché. Cela vous permet d'utiliser votre nom d'utilisateur ou d'utilisatrice pour vous authentifier, en les comparant aux informations stockées dans Kerberos.

      Cette case est disponible ou non selon la distribution Hadoop à laquelle vous vous connectez.

      User Name

      Nom d'utilisateur·trice.

      Name node end point

      URI du NameNode, le cœur du système de fichier HDFS.

      Job tracker end point

      URI du nœud Job Tracker, qui sous-traite les tâches MapReduce dans des nœuds spécifiques du cluster.

      Oozie end point

      URI de la console Web d'Oozie, pour le monitoring de l'exécution du Job.

      Hadoop Properties

      Si vous devez utiliser une configuration personnalisée pour la distribution d'Hadoop à utiliser, renseignez cette table avec la ou les propriété(s) à personnaliser. Lors de l'exécution, les propriétés personnalisées écrasent celles par défaut utilisées par le Studio pour son moteur Hadoop.

      Pour plus d'informations concernant les propriétés requises par Hadoop, consultez la documentation de Apache Hadoop à l'adresse suivante : http://hadoop.apache.org (en anglais) ou la documentation de la distribution Hadoop que vous utilisez.

      Remarque :

      Les paramètres configurés dans cette table sont effectifs dans le Job pour lequel ils ont été définis.

Résultats

Une fois le chemin de déploiement configuré dans la vue Oozie scheduler, vous pouvez planifier les exécutions de votre Job, ou l'exécuter immédiatement sur le serveur HDFS.