Configurer l'écriture de données dans la base HBase - 7.1

HBase

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants HBase
Gouvernance de données > Systèmes tiers > Composants Database > Composants HBase
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants HBase
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Pour ce faire, procédez comme suit :

Procédure

  1. Dans l'espace de modélisation graphique, double-cliquez sur le composant tFixedFlowInput pour ouvrir sa vue Component.
  2. Dans cette vue, cliquez sur le bouton [...] à côté du champ Edit schema afin d'ouvrir l'éditeur de schéma.
  3. Cliquez trois fois sur le bouton [+] pour ajouter trois lignes, puis, dans la colonne Column, renommez respectivement les trois lignes comme suit : id, name et age.
  4. Dans la colonne Type, cliquez sur chacune de ces lignes, puis dans la liste déroulante, sélectionnez le type de données de chaque ligne. Dans ce scénario, sélectionnez Integer pour id et age, String pour name.
  5. Cliquez sur OK pour valider ces modifications et acceptez la propagation proposée par la boîte de dialogue qui s'ouvre.
  6. Dans la zone Mode, sélectionnez Use Inline Content (delimited file) pour afficher les champs à éditer.
  7. Dans le champ Content, saisissez les données délimitées à écrire dans la base de données HBase, séparées par un ";". Dans cet exemple, ils sont :
    
                      1;Albert;23
    2;Alexandre;24
    3;Alfred-Hubert;22
    4;Andre;40
    5;Didier;28
    6;Anthony;35
    7;Artus;32
    8;Catherine;34
    9;Charles;21
    10;Christophe;36
    11;Christian;67
    12;Danniel;54
    13;Elisabeth;58
    14;Emile;32
    15;Gregory;30 
                   
  8. Double-cliquez sur le composant tHBaseOutput afin d'afficher sa vue Component.
    Remarque : Si ce composant n'a pas le même schéma que le composant précédent, une icône d'avertissement s'affiche. Dans ce cas, cliquez sur le bouton Sync columns afin de récupérer le schéma du composant précédent. Cela fait, l'icône disparaît.
  9. Cochez la case Use an existing connection puis sélectionnez la connexion que vous avez configurée précédemment. Dans cet exemple, sélectionnez tHBaseConnection_1.
  10. Dans le champ Table name, saisissez le nom de la table à créer dans la base de données HBase. Dans cet exemple, saisissez customer.
  11. Dans le champ Action on table, sélectionnez l'action que vous souhaitez effectuer, dans la liste déroulante. Dans ce scénario, sélectionnez Drop table if exists and create. Ainsi, si une table nommée customer existe déjà dans la base de données HBase, elle sera effacée avant la création de la nouvelle table.
  12. Cliquez sur l'onglet Advanced settings afin d'ouvrir la vue correspondante.
  13. Dans la table Family parameters, ajoutez deux lignes en cliquant deux fois sur le bouton [+] et renommez-les respectivement family1 et family2. Laissez les autres colonnes vides. Ces deux colonnes seront créées dans la base de données HBase avec les options de performances par défaut.
    Remarque : La table Family parameters est disponible uniquement lorsque l'action sélectionnée dans la liste Action on table est de créer une table dans la base de données HBase. Pour plus d'informations concernant la table Family parameters, consultez pour le tHBaseOutput.

  14. Dans la table Families de la vue Basic settings, saisissez le nom des familles dans la colonne Family name, chaque nom correspondant à la colonne contenue par la famille. Dans cet exemple, les colonnes id et age appartiennent à la famille family1 et la colonne name à la famille family2.
    Remarque : Ces familles de colonnes doivent déjà exister dans la base de données HBase à laquelle vous vous connectez ou elles doivent être définies dans la table Family parameters de la vue Advanced settings.