Utiliser Hive sur un cluster Amazon EMR
Cet exemple utilise les produits suivants sous licence fournis par Amazon :
- Amazon EC2
- Amazon EMR
Pour plus d'informations relatives au lancement d'un cluster Amazon EMR dans le Studio Talend, consultez Amazon EMR - Prise en main.
Créer une métadonnée de connexion à Hive
Avant de commencer
Un cluster Amazon EMR 4.0.0 est déjà lancé et vous avez configuré la métadonnée du cluster dans le référentiel Talend.
Procédure
Créer une table Hive
Avant de commencer
Un fichier CustomersData a déjà été écrit dans HDFS et va être converti en table Hive.
Dans l'exemple suivant, nous utilisons l'assistant de création de tables Hive.
Procédure
Effectuer l'analyse d'une table Hive
Avant de commencer
Vous pouvez utiliser les capacités de calcul de votre cluster pour effectuer des analyses sur votre table Hive.
Procédure
Chaque analyse est envoyée à votre cluster sous forme de requête Hive QL et est exécutée comme un Job MapReduce.
Les résultats de l'analyse s'affichent dans le Studio Talend sous forme de graphiques ou de tables.
Pour plus d'informations relatives aux autres utilisations des tables, consultez l'article Work with Amazon Relational Database Service (RDS).