Créer une connexion à HBase - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Procédure

  1. Développez le nœud Hadoop cluster situé sous le nœud Metadata dans la vue Repository. Cliquez-droit sur la connexion Hadoop à utiliser et sélectionnez Create HBase dans le menu contextuel.
  2. Dans l'assistant de connexion qui s'ouvre, renseignez les propriétés génériques de la connexion que vous devez créer, notamment le nom (champ Name), l'objectif (champ Purpose) et la Description. Le champ Status est un champ que vous pouvez personnaliser dans la fenêtre [File] > [Edit project properties].
  3. Cliquez sur Next pour passer à l'étape suivante et renseigner les informations de connexion à la base de données HBase. Parmi ces informations, DB Type, Hadoop cluster, Distribution, HBase version et Server sont automatiquement pré-remplies avec les propriétés héritées de la connexion Hadoop que vous avez sélectionnée dans les étapes précédentes.
    Notez que si vous choisissez None dans la liste Hadoop cluster, vous basculez dans un mode manuel dans lequel les données héritées sont abandonnées. Vous devez donc configurer chaque propriété vous-même. La connexion créée apparaît sous le nœud Db connection uniquement.
  4. Dans le champ Port, saisissez le numéro du port de la base de données HBase à laquelle vous connecter.
    Remarque :

    Afin que le nom d'hôte du serveur Hadoop soit reconnu par les ordinateurs client et hôte, vous devez établir une entrée de mapping de l'adresse IP et du nom d'hôte pour ce nom d'hôte dans le fichier hosts des ordinateurs client et hôte. Par exemple, si le nom d'hôte du serveur Hadoop est talend-all-hdp et que son adresse IP est 192.168.x.x, l'entrée de mapping est 192.168.x.x talend-all-hdp. Pour un système Windows, vous devez ajouter l'entrée dans le fichier C:\WINDOWS\system32\drivers\etc\hosts (en supposant que Windows est installé sur le lecteur C). Pour un système Linux, vous devez modifier l'entrée du fichier /etc/hosts.

  5. Dans le champ Column family, saisissez, si vous souhaitez filtrer les colonnes, la famille de colonnes puis cliquez sur Check afin de vérifier votre connexion.
  6. Si vous accédez à une distribution Hadoop s'exécutant avec la sécurité de Kerberos, cochez cette case puis, saisissez le Principal name pour le NameNode dans le champ qui s'affiche. Cela vous permet d'utiliser votre nom d'utilisateur pour vous authentifier, en les comparant aux informations stockées dans Kerberos.
    Si vous devez utiliser un fichier Keytab pour vous identifier, cochez la case Use a keytab to authenticate. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le Principal à utiliser dans le champ Principal. Dans le champ Keytab, parcourez votre système jusqu'au fichier Keytab à utiliser.
    L'utilisateur exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier keytab à utiliser.
  7. Si vous devez utiliser une configuration personnalisée pour la distribution d'Hadoop ou HBase à utiliser, cliquez sur le bouton [...] à côté de Hadoop properties afin d'ouvrir la table des propriétés et ajouter la ou les propriété(s) à personnaliser. Lors de l'exécution, les propriétés personnalisées écrasent celles par défaut utilisées par le studio pour son moteur Hadoop.
    Une table Parent Hadoop properties s'affiche au-dessus de la table des propriétés que vous modifiez. La table mère est en lecture seule et affiche les propriétés Hadoop ayant été définies dans l'assistant de la connexion Hadoop mère, sur laquelle se base la connexion à HBase.
    Pour plus d'informations concernant les propriétés Hadoop, consultez la documentation Apache Hadoop à l'adresse suivante http://hadoop.apache.org/docs/current/ (en anglais), ou la documentation de la distribution Hadoop que vous utilisez. Par exemple, la page suivante liste certaines des propriétés Hadoop par défaut : https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/core-default.xml (en anglais).
    Pour plus d'informations concernant les propriétés de HBase, consultez la documentation de Apache HBase. Par exemple, la page suivante liste certaines propriétés de configuration de HBase par défaut http://hbase.apache.org/book.html#_configuration_files.
    Pour tirer parti de cette table des propriétés, consultez Configuration des propriétés réutilisables de Hadoop.
  8. Cliquez sur Finish pour valider les modifications.
    La nouvelle connexion HBase apparaît dans la vue Repository, sous le nœud Hadoop cluster. De plus, comme la connexion HBase est une connexion de base de données, cette nouvelle connexion apparaît également sous le nœud Db connections.
    Remarque :

    La vue Repository dépend de l'édition du studio que vous utilisez.

Résultats

Si vous devez utiliser un contexte environnemental pour définir les paramètres de cette connexion, cliquez sur le bouton Export as context pour ouvrir l'assistant correspondant et choisir parmi les options suivantes :
  • Create a new repository context : créer le contexte environnemental depuis la connexion Hadoop courante, c'est-à-dire que les paramètres à configurer dans l'assistant sont pris comme variables de contexte avec les valeurs données à ces paramètres.

  • Reuse an existing repository context : utiliser les variables d'un contexte environnemental afin de configurer la connexion courante.

Si vous devez annuler l'implémentation du contexte, cliquez sur Revert context. Les valeurs des variables de contexte utilisées sont directement mises dans l'assistant.

Pour un exemple étape par étape concernant l'utilisation de la fonctionnalité Export as context, consultez Exporter une métadonnée en tant que contexte et réutiliser ses paramètres pour configurer une connexion.