Accéder au contenu principal Passer au contenu complémentaire

Connexion à une distribution Hadoop personnalisée

Lorsque vous sélectionnez l'option Custom dans la liste déroulante Distribution, vous vous connectez à une distribution Hadoop différente de celles fournies dans la liste Distribution dans le Studio Talend.

Pourquoi et quand exécuter cette tâche

Une fois l'option Custom (Personnalisée) sélectionnée, cliquez sur le bouton [...] pour ouvrir la boîte de dialogue Import custom definition (Importer la définition personnalisée) et procédez comme suit :

Notez que les versions personnalisées ne sont pas officiellement supportées par Talend. Talend et sa Communauté fournissent l'opportunité de vous connecter à des versions personnalisées depuis le Studio Talend mais ne peuvent garantir que la configuration de la version choisie sera simple, car de nombreuses versions et distributions d'Hadoop différentes sont disponibles. Il est recommandé de configurer cette connexion uniquement si vos connaissances relatives à Hadoop sont suffisantes pour gérer d'éventuels problèmes par vous-même.

Procédure

  1. Selon votre cas, sélectionnez Import from existing version ou Import from zip afin de configurer la distribution Hadoop personnalisée à laquelle vous souhaitez vous connecter.
    • Si vous avez le fichier .zip de configuration de la distribution Hadoop personnalisée à laquelle vous connecter, sélectionnez Import from zip.

    • Sinon, sélectionnez Import from existing version pour importer une distribution Hadoop de base officiellement supportée afin de la personnaliser en suivant les instructions de l'assistant. Adopter cette approche nécessite des connaissances relatives à la configuration de la distribution Hadoop à utiliser.

    Boîte de dialogue Import custom definition (Importer la définition personnalisée).
    Notez que les cases de cet assistant vous permettent de cocher les éléments Hadoop que vous souhaitez importer. Selon le contexte dans lequel vous créez la connexion, toutes les cases ne sont pas disponibles. Par exemple, si vous créez cette connexion pour Spark, seule la case Spark s'affiche.
  2. Que vous ayez sélectionné Import from existing version ou Import from zip, vérifiez que chaque case à côté de l'élément Hadoop que vous souhaitez importer est cochée.
  3. Cliquez sur OK et, dans la fenêtre d'avertissement, cliquez sur Yes pour accepter d'écraser toute configuration personnalisée des fichiers JAR précédemment implémentée.
    La boîte de dialogue Custom Hadoop version definition devient active.
    Boîte de dialogue Define custom Hadoop distribution (Définir la distribution Hadoop personnalisée).
    Cette boîte de dialogue liste les éléments Hadoop et les fichiers Jar que vous importez.
  4. Si vous avez sélectionné l'option Import from zip, cliquez sur OK afin de valider la configuration importée.
    Si avez sélectionné l'option Import from existing version, afin d'importer une distribution de base, vous devez également importer des fichiers jar pour personnaliser cette distribution. Dans l'onglet de l'élément Hadoop que vous souhaitez personnaliser, par exemple l'onglet Spark, cliquez sur le bouton [+] pour ouvrir la boîte de dialogue Select libraries.
  5. Sélectionnez l'option External libraries pour ouvrir sa vue.
  6. Parcourez votre système jusqu'au fichier Jar que vous souhaitez importer.
  7. Cliquez sur OK pour valider les modifications et fermer la boîte de dialogue Select libraries.
    Le fichier JAR sélectionné s’affiche dans la liste de l'onglet de l'élément Hadoop configuré.
    Notez que si vous souhaitez partager la configuration personnalisée Hadoop avec un autre Studio Talend, vous pouvez exporter cette connexion personnalisée de la boîte de dialogue Custom Hadoop version definition en cliquant sur le bouton export.
  8. Dans la boîte de dialogue Custom Hadoop version definition, cliquez sur OK afin de valider la configuration personnalisée. Vous retournez à la vue de configuration dans laquelle vous avez sélectionné l'option Custom.

Résultats

Une fois la configuration de la distribution Hadoop personnalisée terminée, vous pouvez continuer à saisir d'autres paramètres requis pour la connexion depuis la vue de configuration de la connexion à Hadoop.

Si la distribution Hadoop personnalisée à laquelle vous souhaitez vous connecter contient YARN et que vous souhaitez l'utilisez, cochez la case Use YARN à côté de la liste Distribution.

Une vidéo est disponible à l'adresse suivante, pour expliquer, en prenant l'exemple de HDFS, comment configurer une connexion à un cluster Hadoop personnalisé, ou distribution Hadoop non supportée : How to add an unsupported Hadoop distribution to the Studio (en anglais).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !