サンプルデータを分割してKuduに書き込む - Cloud - 8.0

Kudu

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Kudu
データガバナンス > サードパーティーシステム > DBコンポーネント > Kudu
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Kudu

手順

  1. tFixedFlowIput コンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。

  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、スキーマエディターを開きます。
  3. この画像に示すように、[+]ボタンをクリックしてスキーマカラムを追加します。

  4. [Type] (タイプ)カラムでは、ageカラムに[Integer] (整数)を選択します。
  5. [Key] (キー)カラムでは、ageカラムのチェックボックスをオンにして、このカラムをプライマリキーカラムとして定義します。
  6. [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
  7. [Mode] (モード)エリアの[Use Inline Content] (インラインコンテンツを使う)ラジオボタンを選択して、上記のサンプルデータを、表示されている[Content] (コンテンツ)フィールドに貼り付けます。
  8. [Field separator] (フィールド区切り)フィールドでセミコロン(;)を入力します。
  9. tKuduOutputコンポーネントをダブルクリックして、[Component] (コンポーネント)ビューを開きます。

  10. [Component List] (コンポーネントリスト)ドロップダウンリストで、[Use an existing configuration] (既存の設定を使う)チェックボックスをオンにし、前の手順で設定したKudu設定を選択します。
  11. tKuduOutputtFixedFlowInputと同じスキーマを持つように、[Sync columns] (カラムを同期)をクリックします。
  12. [Table] (テーブル)フィールドに、Kuduで作成するテーブルの名前を入力します。
  13. [Action on table] (テーブルでのアクション)ドロップダウンリストから[Drop table if exists and create] (テーブルが存在する場合、ドロップして作成)を選択します。
  14. [Range partitions] (範囲パーティション)[+]ボタンをクリックして1行を追加し、以下の操作を行います。
    1. [Partition No] (パーティション番号)に、作成するパーティションのIDとして使う番号を二重引用符なしで入力します。たとえば、1を入力してパーティション1を作成します。
    2. [Partition column] (パーティションカラム)で、パーティショニングに使うプライマリキーカラムを選択します。このシナリオでは、ageを選択します。
    3. 年齢データのタイプは整数であるため、[Lower boundary] (下限)に二重引用符なしで20を入力します。
    4. [Upper boundary] (上限)も同じようにして、60に設定します。
    このパーティション定義は、次のようにパーティションスキーマの読み取りを作成します。
    RANGE (age) (
        PARTITION 20 <= VALUES < 60
    )
    このパーティションスキーマによると、下限20歳のレコードはこのパーティションに含まれているため、Kuduに書き込まれますが、上限60歳のレコードは除外され、Kuduに書き込まれません。

    実際には、Kuduテーブルにすべてのデータを書き込む必要がある場合は、適切な境界でデータを受け取るために、より多くのパーティションを定義します。

  15. [Action on data] (データでのアクション)ドロップダウンリストから[Insert] (挿入)を選択します。