Kuduからデータをスキャンする - Cloud - 8.0

Kudu

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Kudu
データガバナンス > サードパーティーシステム > DBコンポーネント > Kudu
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Kudu

手順

  1. tKuduInputをダブルクリックして、[Component] (コンポーネント)ビューを開きます。

  2. [Edit schema] (スキーマを編集)の横の[...]ボタンをクリックし、スキーマエディターを開きます。
  3. この画像に示すように、[+]ボタンをクリックしてスキーマ出力カラムを追加します。

  4. [Type] (型)フィールドで、ageカラムのデータ型として[Integer] (整数)を選択します。
  5. [Key] (キー)カラムでageカラムのチェックボックスをオンにします。これがプライマリキーカラムだからです。
  6. [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
  7. [Table name] (テーブル名)フィールドに、データを読み取るテーブルの名前を入力します。このシナリオでは、ychen_kuduです。
  8. [Query mode] (クエリーモード)エリアで[Use scan] (スキャンを使う)ラジオボタンを選択して、Kuduテーブルからすべてのデータを読み取ります。
  9. tLogRowをダブルクリックして[Component] (コンポーネント)ビューを開き、[Table] (テーブル)ラジオボタンを選択して結果をテーブルに表示します。
  10. [F6] を押してこのジョブを実行します。

タスクの結果

完了したら、 [Run] (実行)ビューのコンソールで、Kuduテーブルから読み取ったデータを確認できます。

レコード04;tom;60はパーティションの境界を超えているため、テーブルに書き込まれていません。

実際の運用では、実行に成功した場合、Talend JobServerがあればそこでジョブをデプロイし、起動できます。

関連情報は、Talend Help Center(https://help.talend.com)でジョブをリモート実行する方法を検索してください。