このタスクについて
手順
-
tHiveLoadをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
- [Component list] (コンポーネントリスト)の[Use an existing connection] (既存の接続を使用)チェックボックスをオンにし、このジョブに使用している、tHiveConnectionコンポーネントで設定した接続を選択します。
- [Load action] (ロードアクション)フィールドの[LOAD]を選択して、このシナリオの開始時に紹介したサンプルデータを保持するファイルからデータを書き込みます。
-
[File path] (ファイルパス)フィールドに、サンプルデータが格納されたディレクトリーを入力します。この例の場合、使用するデータはHDFSシステム内にあります。
本番環境では、tHDFSOutputを使ってデータをHDFSシステムに書き込むことができます。その場合、Hiveアプリケーションにデータの読み取り権限のほか、データの移動権限もあることをご確認ください。
tHDFSOutputの詳細は、tHDFSOutputをご覧ください。
関連する権限の詳細は、ドキュメントを参照するか、使用するHadoopクラスターの管理者にお問い合わせください。
HDFSシステム以外のローカルファイルシステムからデータを読み取る必要がある場合は、ジョブが実行されるマシンのローカルファイルシステムに読み取るデータを格納し、この[Basic settings] (基本設定)ビューの[Local] (ローカル)チェックボックスをオンにします。たとえば、Hiveへの接続モードがスタンドアロンの場合、Hiveアプリケーションがインストールされたマシンでジョブが実行されるので、データをそのマシンに格納する必要があります。 - [Table name] (テーブル名)フィールドに、データをロードする必要があるターゲットテーブルの名前を入力します。このシナリオでは、employeesです。
- [Action on file] (ファイルに実行するアクション)リストから[APPEND]を選択します。
- [Set partitions] (パーティションの設定)チェックボックスをオンにし、フィールドが表示されたら、データを追加する必要があるパーティションを入力します。このシナリオでは、country='US'です。