HBaseへのデータ書き込みプロセスを設定 - 7.3

HBase

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > HBase
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > HBase
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > HBase
Last publication date
2024-02-22

このタスクについて

そのためには、次の手順に従います。

手順

  1. デザインワークスペースでtFixedFlowInputコンポーネントをクリックして[Component] (コンポーネント)ビューを開きます。
  2. このビューの[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、スキーマエディターを開きます。
  3. [+]ボタンを3回クリックして、[Column] (カラム)カラムに3つの行を追加し、それぞれidnameageに名前変更します。
  4. [Type] (データ型)カラムでこれらの各行をクリックし、ドロップダウンリストで各行のデータ型を選択します。このシナリオの場合、idage整数型name文字列型です。
  5. [OK]をクリックしてこれらの変更を確定し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
  6. [Mode] (モード)エリアの[Use Inline Content (delimited file)] (インラインコンテンツを使用: 区切りファイル)をオンにしてフィールドを表示し、編集します。
  7. HBaseに書き込む、セミコロン";"で区切ったデータを[Content] (コンテンツ)フィールドに入力します。この例では次のようになります。
    
                      1;Albert;23
    2;Alexandre;24
    3;Alfred-Hubert;22
    4;Andre;40
    5;Didier;28
    6;Anthony;35
    7;Artus;32
    8;Catherine;34
    9;Charles;21
    10;Christophe;36
    11;Christian;67
    12;Danniel;54
    13;Elisabeth;58
    14;Emile;32
    15;Gregory;30 
                   
  8. tHBaseOutputをダブルクリックして[Component] (コンポーネント)ビューを開きます。
    注: このコンポーネントに先行コンポーネントと同じスキーマが存在しない場合は、警告アイコンが表示されます。その場合は、[Sync columns] (カラムを同期)ボタンをクリックして、先行コンポーネントのスキーマを取得します。取得すると警告アイコンが消えます。
  9. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにし、あらかじめ設定しておいた接続を選択します。このサンプルでは、tHBaseConnection_1です。
  10. [Table name] (テーブル名)フィールドに、HBaseで作成するテーブルの名前を入力します。この例では、customerです。
  11. [Action on table] (テーブルでのアクション)フィールドのドロップダウンリストで、目的のアクションを選択します。このシナリオでは、[Drop table if exists and create] (テーブルが存在する場合はドロップして作成)を選択します。このようにすると、customerというテーブルが既にHBaseに存在していても、そのテーブルが無効化され、削除されてから、この現在のテーブルが作成されます。
  12. [Advanced settings] (詳細設定)タブをクリックして、対応するビューを開きます。
  13. [+]ボタンをクリックして2つの行を[Family parameters] (ファミリーパラメーター)テーブルに追加して、それぞれの名前をfamily1family2に変更し、他のカラムは空のままにします。これらの2つのカラムファミリーは、デフォルトのファミリーパフォーマンスオプションを使ってHBaseに作成されます。
    注: [Action on table] (テーブルでのアクション)フィールドで、HBaseにテーブルを作成するアクションを選択しないと、[Family parameters] (ファミリーパラメーター)テーブルは使用できません。この[Family parameters] (ファミリーパラメーター)テーブルの詳細は、tHBaseOutputをご覧ください。

  14. [Basic settings] (基本設定)ビューの[Families] (ファミリー)テーブルの[Family name] (ファミリー名)カラムに、このファミリーに含まれるカラムに対応するファミリー名をそれぞれ入力します。この例では、idカラムとageカラムがfamily1に、nameカラムがfamily2に属します。
    注: これらのカラムファミリーは、接続するHBaseに既に存在しているはずです。存在しない場合は、ランタイムで作成されるように[Advanced settings] (詳細設定)ビューで[Family parameters] (ファミリーパラメーター)テーブルを定義する必要があります。