Récupérer le schéma d'une table - 7.1

Guide utilisateur de Talend Big Data Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
task
Création et développement
EnrichPlatform
Studio Talend

Dans cette étape, vous allez récupérer le schéma de la table de la base de données HBase connectée.

Avertissement : Si vous travaillez sur un projet géré par SVN ou Git alors que l'option Manual lock est cochée dans Talend Administration Center, assurez-vous de verrouiller manuellement votre connexion dans le Repository avant de récupérer ou de mettre à jour des schémas de table. Sinon, la connexion est en lecture seule et le bouton Finish de l'assistant n'est pas disponible. Pour plus d'informations concernant le verrouillage et le déverrouillage d'un élément du projet ainsi que les différents types de verrouillage, consultez Travailler sur un projet partagé.

Procédure

  1. Dans la vue Repository, cliquez-droit sur la nouvelle connexion et sélectionnez Retrieve schema dans le menu contextuel puis cliquez sur Next dans l'assistant qui s'ouvre afin de voir et filtrer les différentes tables de la base de données HBase.
    Vous pouvez définir le nombre de colonnes à afficher pour chaque famille de colonnes dans le champ Limit.
    Si vous souhaitez configurer cette limite pour toutes les métadonnées de connexion à HBase/MapR-DB à définir dans le Référentiel, configurez la limite dans le champ HBase/MapR-DB scan limit dans Preferences > Talend > Performance.
  2. Développez le nœud de la table ainsi que la famille de la colonne et sélectionnez les colonnes qui vous intéressent. Cliquez sur Next pour ouvrir une nouvelle vue dans l'assistant, listant les schémas de la table sélectionnée. Vous pouvez sélectionner n'importe quel schéma pour afficher ses détails dans la zone Schema, du côté droit de l'assistant.
    Avertissement : Si la table de la base de données source contient une valeur par défaut étant une fonction ou une expression et non une chaîne de caractères, assurez-vous de supprimer les guillemets simples entourant la valeur par défaut du schéma final, s'il y en a, afin d'éviter des résultats inattendus lors de la création de tables de bases de données à l'aide de ce schéma. Pour plus d'informations, consultez Vérifier les valeurs par défaut dans un schéma récupéré.
  3. Modifiez le schéma si nécessaire. Vous pouvez renommer le schéma et personnaliser la structure du schéma selon vos besoins dans la zone Schema.
    La barre d'outils vous permet d'ajouter, supprimer ou déplacer des colonnes dans votre schéma.
    Pour écraser les modifications effectuées sur le schéma sélectionné avec le schéma par défaut, cliquez sur Retrieve schema. Notez que toutes les modifications apportées au schéma seront perdues si vous cliquez sur ce bouton.
  4. Cliquez sur Finish pour terminer la création du schéma de la base de données. Tous les schémas récupérés sont affichés sous le nœud HBase connection correspondant dans le Repository.
    Si vous devez éditer ultérieurement le schéma, cliquez-droit sur le schéma et sélectionnez Edit Schema dans le menu contextuel pour ouvrir à nouveau l'assistant et effectuer vos modifications.
    Avertissement :

    Si vous modifiez les schémas, assurez-vous que le type de données est bien défini dans le colonne Type.

Résultats

Comme expliqué précédemment, vous pouvez utiliser le nœud Hadoop cluster ou également créer une connexion HBase et récupérer les schémas du nœud Db connection. Dans tous les cas, vous devez toujours configurer les propriétés spécifiques de connexion à HBase. A cette étape :
  • si vous sélectionnez l'option Repository dans la liste Hadoop cluster pour réutiliser les détails d'une connexion Hadoop établie, la connexion HBase créée sera classée à la fois sous le nœud Hadoop cluster et le nœud Db connection ;

  • sinon, si vous sélectionnez l'option None dans la liste Hadoop cluster afin de saisir vous-même les propriétés de la connexion Hadoop, la connexion HBase créée apparaît uniquement sous le nœud Db connection.