Accéder au contenu principal Passer au contenu complémentaire

Récupérer le schéma d'une table Hive

Dans cette étape, le schéma de la table de la base de données Hive connectée est récupéré.

Note InformationsAvertissement : Si vous travaillez sur un projet géré par Git alors que l'option Manual lock est cochée dans Talend Administration Center, assurez-vous de verrouiller manuellement votre connexion dans le Repository avant de récupérer ou de mettre à jour des schémas de table. Sinon, la connexion est en lecture seule et le bouton Finish de l'assistant n'est pas disponible. Pour plus d'informations concernant le verrouillage et le déverrouillage d'un élément du projet ainsi que les différents types de verrouillage, consultez Travailler sur un projet partagé.

Procédure

  1. Dans la vue Repository, cliquez-droit sur la connexion Hive utilisée et sélectionnez Retrieve schema dans le menu contextuel. Cliquez ensuite sur Next dans l'assistant qui s'ouvre afin de voir et filtrer les différentes table de cette base de données Hive.
    Boîte de dialogue New Schema in connection "VM-Hive" (Nouveau schéma dans la connexion "VM-Hive") affichant le schéma à sélectionner.
  2. Développez le nœud des tables que vous souhaitez utiliser et sélectionnez les colonnes que vous souhaitez récupérer. Cliquez sur Next pour ouvrir une nouvelle vue dans l'assistant, listant le(s) schéma(s) de la table sélectionnée. Vous pouvez sélectionner n'importe quel schéma pour afficher ses détails dans la zone Schema, du côté droit de l'assistant.
    Boîte de dialogue New Schema in connection "VM-Hive" (Nouveau schéma dans la connexion "VM-Hive") affichant les schémas ajoutés au référentiel.
    Note InformationsAvertissement : Si la table de la base de données source contient une valeur par défaut étant une fonction ou une expression et non une chaîne de caractères, assurez-vous de supprimer les guillemets simples entourant la valeur par défaut du schéma final, s'il y en a, afin d'éviter des résultats inattendus lors de la création de tables de bases de données utilisant ce schéma.
  3. Modifiez, si nécessaire, le schéma sélectionné. Vous pouvez renommer le schéma et personnaliser la structure du schéma selon vos besoins dans la zone Schema.
    La barre d'outils vous permet d'ajouter, supprimer ou déplacer des colonnes dans votre schéma.
    Pour écraser les modifications effectuées sur le schéma sélectionné avec le schéma par défaut, cliquez sur Retrieve schema. Notez que toutes les modifications apportées au schéma seront perdues si vous cliquez sur ce bouton.
  4. Cliquez sur Finish pour terminer la récupération du schéma de la table Hive. Tous les schémas récupérés sont affichés sous le nœud Hive correspondant dans la vue Repository.
    Si vous devez modifier ultérieurement le schéma, cliquez-droit sur le schéma et sélectionnez Edit Schema dans le menu contextuel pour ouvrir à nouveau l'assistant et effectuer vos modifications.
    Note InformationsAvertissement :

    Si vous modifiez les schémas, assurez-vous que le type de données est bien défini dans le colonne Type.

Résultats

Comme expliqué précédemment, en plus d'utiliser le nœud Hadoop cluster, vous pouvez également partir du nœud Db connection afin de créer une connexion Hive et récupérer des schémas. Dans tous les cas, vous devez configurer les propriétés spécifiques de connexion à Hive. A cette étape :
  • si vous sélectionnez l'option Repository dans la liste Hadoop cluster pour réutiliser les détails d'une connexion Hadoop établie, la connexion Hive créée sera classée à la fois sous le nœud Hadoop cluster et le nœud Db connection ;

  • si vous sélectionnez l'option None dans la liste Hadoop cluster afin de renseigner vous-même les propriétés de la connexion Hadoop, la connexion Hive créée apparaît uniquement sous le nœud Db connection.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.