HCatalogデータベースのセットアップ - 7.2

ビッグデータジョブの例

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > ジョブデザイン
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション
ジョブデザインと開発 > ジョブデザイン > ジョブフレームワーク > 標準ジョブ

手順

  1. このサンプルでは、HDFS_ClearResultsというラベルが付いているtHDFSDeleteコンポーネントをダブルクリックし、[Component] (コンポーネント)タブで[Basic settings] (基本設定)ビューを開きます。
  2. 一元管理されているHDFS接続を使用する場合は、[Property Type] (プロパティのタイプ)リストボックスをクリックして[Repository] (リポジトリー)を選択します。次に、[...]ボタンをクリックして[Repository Content] (リポジトリーのコンテンツ)ダイアログボックスを開きます。
  3. HDFSシステムへの接続用に定義されているHDFS接続を選択し、[OK]をクリックします。

    該当するフィールドに、接続情報がすべて自動的に入力されます。

  4. [File or Directory Path] (ファイルまたはディレクトリーパス)フィールドに、HDFS上でアクセスログファイルが保管されるディレクトリーを指定します。この例では、 /user/hdp/weblogです。
  5. このサンプルではHCatalog_Create_DBというラベルが付いている1番目のtHCatalogOperationコンポーネントをダブルクリックし、[Component] (コンポーネント)タブで[Basic settings] (基本設定)ビューを開きます。
  6. 一元管理されているHDFS接続を使用する場合は、[Property Type] (プロパティのタイプ)リストボックスをクリックして[Repository] (リポジトリー)を選択します。次に、[...]ボタンをクリックして[Repository Content] (リポジトリーのコンテンツ)ダイアログボックスを開きます。
  7. HCatalogデータベースへの接続用に定義されているHCatalog接続を選択し、[OK]をクリックします。該当するフィールドに、接続情報がすべて自動的に入力されます。
  8. [Operation on] (オペレーション先)リストで[Database] (データベース)を選択し、[Operation] (オペレーション)リストで[Drop if exist and create] (既存する場合はドロップして作成)を選択します。
  9. [Drop configuration] (ドロップ設定)エリアの[Option] (オプション)リストで、[Cascade] (カスケード)を選択します。
  10. [Database location] (データベースの場所)フィールドに、HDFS上でデータベースファイルを作成する場所を入力します。この例では、「/user/hdp/weblog/weblogdb」です。