Centraliser des métadonnées Hive - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Si vous avez souvent besoin d'utiliser une table de base de données provenant de Hive, vous pouvez centraliser les informations de connexion à la base de données Hive et les détails du schéma de la table dans le dossier Metadata du Repository.

Bien que vous puissiez toujours le faire à partir du mode DB connection, l'utilisation du nœud Hadoop cluster est une alternative qui permet une meilleure utilisation des propriétés de connexion centralisées pour une distribution Hadoop donnée.

Prérequis :

  • Lancez la distribution Hadoop que vous souhaitez utiliser et assurez-vous que vous disposez des permissions d'accès nécessaires pour cette distribution et sa base de données Hive.

  • Créez la connexion vers cette distribution Hadoop depuis le nœud Hadoop cluster. Pour plus d'informations, consultez Centraliser une connexion Hadoop.

Si vous souhaitez utiliser une distribution MapR et une version Hive MapR 2.0.0 ou MapR 2.1.2, procédez comme suit avant de configurer la connexion à Hive :

Procédure

  1. Ajoutez le chemin du client MapR, qui peut varier selon votre système d'exploitation (sous Windows, le chemin est -Djava.library.path=maprclientpath\lib\native\Windows_7-amd64-64) vers le fichier .ini correspondant du Studio Talend, par exemple, Talend-Studio-win-x86_64.ini.
  2. Pour MapR 2.0.0, installez le module maprfs-0.1.jar.
    Pour MapR 2.1.2, installez les modules maprfs-0.20.2-2.1.2.jar et maprfs-jni-0.20.2-2.1.2.jar.
  3. Redémarrez votre studio pour valider vos changements.

Résultats

Pour plus d'informations sur l'installation de modules, consultez la description sur l'identification et l'installation de modules externes dans le Guide d'installation et de migration Talend .