ジョブをビルドする - Cloud - 8.0
Hive
- Version
- Cloud
- 8.0
- Language
- 日本語
- Product
- Talend Big Data
- Talend Big Data Platform
- Talend Data Fabric
- Talend Data Integration
- Talend Data Management Platform
- Talend Data Services Platform
- Talend ESB
- Talend MDM Platform
- Talend Open Studio for Big Data
- Talend Open Studio for Data Integration
- Talend Open Studio for ESB
- Talend Real-Time Big Data Platform
- Module
- Talend Studio
- Content
- ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Hive
- データガバナンス > サードパーティーシステム > DBコンポーネント > Hive
- データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Hive
手順
-
Talend Studioの[Repository] (リポジトリー)ビューで[Job Designs] (ジョブデザイン)を右クリックし、[Create Standard Job] (標準ジョブを作成) をクリックします。
-
ジョブに名前を付けます。
-
[Finish] (終了)をクリックします。
-
ワークスペースにtPreJobコンポーネントを追加します。
-
ワークスペースにtHiveConnectionコンポーネントを追加します。
-
tHiveConnectionコンポーネントをダブルクリックし、[Property Type] (プロパティタイプ)として[Repository] (リポジトリー)を選択し、上記の手順で作成した[Database Connection] (データベース接続)を選択します。
-
tPreJobコンポーネントを右クリックします。
-
を選択し、tPreJobをtHiveConnectionに接続します。
-
ワークスペースにtHiveInputコンポーネントを追加します。
-
これを選択し、[Use an existing connection] (既存の接続を使用)ボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンメニューでtHiveConnectionコンポーネントを選択します。
-
[Query] (クエリー)フィールドにshow tablesと入力して、データベースで使用可能なテーブルを表示するクエリーを実行します。
-
ワークスペースにtLogRowコンポーネントを追加します。
-
tHiveInputコンポーネントを右クリックし、の順に選択します。
-
tLogRowコンポーネントをクリックして両方のコンポーネントを接続します。上記のクエリーからの情報が表示されます。
-
tLogRowの[Component] (コンポーネント)タブから、[Table (print values in celles of a table)] (テーブル(テーブルのセルに値を出力))を選択します。
-
ワークスペースにtPostJobコンポーネントを追加します。
-
ワークスペースにtHiveCloseコンポーネントを追加します。
-
[On Component Ok] (コンポーネントがOKの場合)接続を使ってtPostJobコンポーネントをtHiveCloseコンポーネントに接続し、開いている接続を閉じます。
-
[Run] (実行)タブから[Run] (実行)をクリックしてジョブを実行し、HDInsightでHiveへの接続が成功していることと、テーブルデータの読みやすさを確認します。