テーブルへのデータの書き込み - 7.3

Hive

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > DBコンポーネント > Hive
データガバナンス > サードパーティーシステム > DBコンポーネント > Hive
データクオリティとプレパレーション > サードパーティーシステム > DBコンポーネント > Hive

このタスクについて

tHiveLoadの設定

手順

  1. tHiveLoadをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
  2. [Component list] (コンポーネントリスト)[Use an existing connection] (既存の接続を使用)チェックボックスをオンにし、このジョブに使用している、tHiveConnectionコンポーネントで設定した接続を選択します。
  3. [Load action] (ロードアクション)フィールドの[LOAD]を選択して、このシナリオの開始時に紹介したサンプルデータを保持するファイルからデータを書き込みます。
  4. [File path] (ファイルパス)フィールドに、サンプルデータが格納されたディレクトリーを入力します。この例の場合、使用するデータはHDFSシステム内にあります。

    本番環境では、tHDFSOutputを使ってデータをHDFSシステムに書き込むことができます。その場合、Hiveアプリケーションにデータの読み取り権限のほか、データの移動権限もあることをご確認ください。

    tHDFSOutputの詳細は、tHDFSOutputを参照してください。

    関連する権限の詳細は、ドキュメントを参照するか、使用するHadoopクラスターの管理者にお問い合わせください。

    HDFSシステム以外のローカルファイルシステムからデータを読み取る必要がある場合は、ジョブが実行されるマシンのローカルファイルシステムに読み取るデータを格納し、この[Basic settings] (基本設定)ビューの[Local] (ローカル)チェックボックスをオンにします。たとえば、Hiveへの接続モードがスタンドアロンの場合、Hiveアプリケーションがインストールされたマシンでジョブが実行されるので、データをそのマシンに格納する必要があります。
  5. [Table name] (テーブル名)フィールドに、データをロードする必要があるターゲットテーブルの名前を入力します。このシナリオでは、employeesです。
  6. [Action on file] (ファイルに実行するアクション)リストから[APPEND]を選択します。
  7. [Set partitions] (パーティションの設定)チェックボックスをオンにし、フィールドが表示されたら、データを追加する必要があるパーティションを入力します。このシナリオでは、country='US'です。