Gérer les métadonnées Hadoop - 7.1

Guide utilisateur de Talend Big Data Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
task
Création et développement
EnrichPlatform
Studio Talend

Dans la vue Repository, le nœud Hadoop cluster du dossier Metadata regroupe les métadonnées des connexions aux éléments Hadoop comme HDFS, Hive ou HBase. Cela vous permet de centraliser les propriétés de connexion définies pour une distribution Hadoop donnée et de réutiliser ces propriétés afin de créer des connexions séparées pour chaque élément de Hadoop.

Cliquez sur le nœud Metadata dans la vue Repository pour développer le dossier. Chaque nœud regroupe les connexions et schémas que vous avez paramétrés. Parmi ces nœuds de connexion, se trouve le nœud Hadoop cluster.

Les sections suivantes expliquent en détail comment utiliser le nœud Hadoop cluster afin de configurer :

  • une connexion HBase,

  • une connexion HCatalog,

  • un schéma de fichier HDFS,

  • une connexion Hive,

  • une connexion Oozie.

Si vous souhaitez créer une connexion à la base de données analytique de Cloudera, Impala, utilisez le nœud DB Connection sous le nœud Metadata du Repository. Sa configuration est similaire à celle d'un composant Hive mais moins compliquée que celle-là.

Pour plus d'informations concernant le nœud DB connection, consultez Centraliser des métadonnées de base de données.