ジョブをビルドする - 7.3

Hive

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Hive
データガバナンス > サードパーティーシステム > DBコンポーネント > Hive
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Hive

手順

  1. Talend Studio[Repository] (リポジトリー)ビューで[Job Designs] (ジョブデザイン)を右クリックし、[Create Standard Job] (標準ジョブの作成)をクリックします。
  2. ジョブに名前を付けます。
  3. [Finish] (終了)をクリックします。
  4. ワークスペースにtPreJobコンポーネントを追加します。
  5. ワークスペースにtHiveConnectionコンポーネントを追加します。
  6. Double-click the tHiveConnection component and choose Repository as the Property Type and the Database Connection created above.
  7. tPreJobコンポーネントを右クリックします。
  8. [Trigger] (トリガー) > [On Component Ok] (コンポーネントがOKの場合)を選択し、tPreJobtHiveConnectionに接続します。
  9. ワークスペースにtHiveInputコンポーネントを追加します。
  10. これを選択し、[Use an existing connection] (既存の接続を使う)ボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンメニューでtHiveConnectionコンポーネントを選択します。
  11. [Query] (クエリー)フィールドにshow tablesと入力して、データベースで使用可能なテーブルを表示するクエリーを実行します。
  12. ワークスペースにtLogRowコンポーネントを追加します。
  13. tHiveInputコンポーネントを右クリックし、[Row] (行) > [Main] (メイン)の順に選択します。
  14. tLogRowコンポーネントをクリックして両方のコンポーネントを接続します。上記のクエリーからの情報が表示されます。
  15. tLogRow[Component] (コンポーネント)タブから、[Table (print values in celles of a table)] (テーブル(テーブルのセルに値を出力))を選択します。
  16. ワークスペースにtPostJobコンポーネントを追加します。
  17. ワークスペースにtHiveCloseコンポーネントを追加します。
  18. [On Component Ok] (コンポーネントがOKの場合)接続を使ってtPostJobコンポーネントをtHiveCloseコンポーネントに接続し、開いている接続を閉じます。
  19. [Run] (実行)タブから[Run] (実行)をクリックしてジョブを実行し、HDInsightでHiveへの接続が成功していることと、テーブルデータの読みやすさを確認します。