Utilisation de Hive dans un cluster Amazon EMR
Cet exemple utilise ces produits sous licence fournis par Amazon :
- Amazon EC2
- Amazon EMR
Pour plus d'informations concernant le lancement d'un cluster Amazon EMR dans le Studio Talend, consultez Amazon EMR - Prise en main.
Création d'une métadonnée de connexion Hive
Avant de commencer
Vous devez avoir lancé un cluster Amazon EMR 4.0.0 et avoir configuré la métadonnée du cluster dans le référentiel Talend.
Procédure
Création d'une table Hive
Avant de commencer
Un fichier nommé CustomersData doit avoir été écrit dans HDFS et devra être converti en table Hive.
Dans l'exemple suivant, nous allons utiliser l'assistant de création de table Hive.
Procédure
Lancement d'une analyse d'une table Hive
Avant de commencer
Vous pouvez utiliser les capacités de calcul de votre cluster pour effectuer des analyses sur votre table Hive.
Procédure
Chaque analyse est envoyée comme une requête Hive QL à votre cluster et est exécutée comme un Job MapReduce.
Les résultats sont affichés dans le Studio Talend sous la forme de graphiques ou de tables.
Pour plus d'informations relatives aux autres utilisations des tables, consultez l'article Work with Amazon Relational Database Service (RDS).