Récupérer le schéma d'une table Hive - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Dans cette étape, vous allez récupérer le schéma de la table de la base de données Hive connectée.

Avertissement : Si vous travaillez sur un projet géré par SVN ou Git alors que l'option Manual lock est cochée dans Talend Administration Center, assurez-vous de verrouiller manuellement votre connexion dans le Repository avant de récupérer ou de mettre à jour des schémas de table. Sinon, la connexion est en lecture seule et le bouton Finish de l'assistant n'est pas disponible. Pour plus d'informations concernant le verrouillage et le déverrouillage d'un élément du projet ainsi que les différents types de verrouillage, consultez Travailler sur un projet partagé.

Procédure

  1. Dans la vue Repository, cliquez-droit sur la connexion Hive utilisée et sélectionnez Retrieve schema dans le menu contextuel. Cliquez ensuite sur Next dans l'assistant qui s'ouvre afin de voir et filtrer les différentes table de cette base de données Hive.
  2. Développez le nœud des tables que vous souhaitez utiliser et sélectionnez les colonnes que vous souhaitez récupérer. Cliquez sur Next pour ouvrir une nouvelle vue dans l'assistant, listant le(s) schéma(s) de la table sélectionnée. Vous pouvez sélectionner n'importe quel schéma pour afficher ses détails dans la zone Schema, du côté droit de l'assistant.
    Avertissement : Si la table de la base de données source contient une valeur par défaut étant une fonction ou une expression et non une chaîne de caractères, assurez-vous de supprimer les guillemets simples entourant la valeur par défaut du schéma final, s'il y en a, afin d'éviter des résultats inattendus lors de la création de tables de bases de données à l'aide de ce schéma. Pour plus d'informations, consultez Vérification des valeurs par défaut dans un schéma récupéré.
  3. Modifiez le schéma si nécessaire. Vous pouvez renommer le schéma et personnaliser la structure du schéma selon vos besoins dans la zone Schema.
    La barre d'outils vous permet d'ajouter, supprimer ou déplacer des colonnes dans votre schéma.
    Pour écraser les modifications effectuées sur le schéma sélectionné avec le schéma par défaut, cliquez sur Retrieve schema. Notez que toutes les modifications apportées au schéma seront perdues si vous cliquez sur ce bouton.
  4. Cliquez sur Finish pour terminer la récupération du schéma de la table Hive. Tous les schémas récupérés sont affichés sous le nœud Hive correspondant dans la vue Repository.
    Si vous devez éditer ultérieurement le schéma, cliquez-droit sur le schéma et sélectionnez Edit Schema dans le menu contextuel pour ouvrir à nouveau l'assistant et effectuer vos modifications.
    Avertissement :

    Si vous modifiez les schémas, assurez-vous que le type de données est bien défini dans le colonne Type.

Résultats

Comme expliqué précédemment, en plus d'utiliser le nœud Hadoop cluster, vous pouvez également partir du nœud Db connection afin de créer une connexion Hive et récupérer des schémas. Dans tous les cas, vous devez configurer les propriétés spécifiques de connexion à Hive. A cette étape :
  • si vous sélectionnez l'option Repository dans la liste Hadoop cluster pour réutiliser les détails d'une connexion Hadoop établie, la connexion Hive créée sera classée à la fois sous le nœud Hadoop cluster et le nœud Db connection ;

  • si vous sélectionnez l'option None dans la liste Hadoop cluster afin de renseigner vous-même les propriétés de la connexion Hadoop, la connexion Hive créée apparaît uniquement sous le nœud Db connection.