Installer Hortonworks Sandbox - 6.1

Talend Data Fabric Guide de prise en main

EnrichVersion
6.1
EnrichProdName
Talend Data Fabric
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Pour une utilisation plus simple, l'une des méthodes pour avoir une plateforme Hadoop en fonctionnement consiste à utiliser une appliance virtuelle de l'un des vendeurs de distribution Hadoop. Hortonworks fournit une appliance/machine virtuelle, ou VM, appelée Sandbox, rapide et facile à configurer. A l'aide de variables de contexte, les Jobs d'exemple du dossier Hortonworks_Sandbox_Samples du projet démo sont configurés pour fonctionner avec la VM de Hortonworks Sandbox.

La procédure qui suit permet de configurer un nœud simple VM avec Hortonworks Sandbox dans Oracle VirtualBox, ce qui est recommandé par Hortonworks. Pour plus d'informations, consultez la documentation de ces vendeurs.

  1. Téléchargez la version recommandée d'Oracle VirtualBox sur https://www.virtualbox.org/ (en anglais) et l'image de Sandbox pour VirtualBox sur http://hortonworks.com/products/hortonworks-sandbox/ (en anglais).

  2. Installez et configurez Oracle VirtualBox en suivant les informations fournies par la documentation d'Oracle VirtualBox.

  3. Installez l'appliance virtuelle de Hortonworks Sandbox dans Oracle VirtualBox en suivant les instructions fournies par Hortonworks Sandbox.

  4. Dans la fenêtre [Oracle VM VirtualBox Manager], cliquez sur Network, puis sur l'onglet Adapter 1. Dans la liste Attached to, sélectionnez Bridged adapter puis, dans la liste Name, sélectionnez la carte réseau physique que vous utilisez.

  5. Démarrez l'appliance virtuelle Hortonworks Sandbox afin d'obtenir une plateforme Hadoop en fonctionnement. Vérifiez que le ping est possible sur l'adresse IP assignée à la machine virtuelle Sandbox.

Ensuite, avant d'ouvrir les Jobs d'exemple, ajoutez une entrée de mapping de domaine IP dans votre fichier hosts, afin de résoudre le nom d'hôte sandbox, défini comme valeur de plusieurs variables de contexte de ce projet démo, au lieu d'utiliser une adresse IP de la machine virtuelle Sandbox. Cela permet de minimiser les changements à apporter dans les variables de contexte configurées.

Pour plus d'informations sur les variables de contexte utilisées dans le projet démo, consultez Comprendre les variables de contexte utilisées dans le projet démo.