3つ目のジョブを設定する - 7.0

ビッグデータジョブのサンプル

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > ジョブデザイン
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション
ジョブデザインと開発 > ジョブデザイン > ジョブフレームワーク > 標準ジョブ
この手順では、3つ目のジョブであるC_HCatalog_Readを設定し、HCatalogにアップロードしたログのコンテンツを確認します。

手順

  1. tHCatalogInputコンポーネントをダブルクリックして、[Component] (コンポーネント)タブに[Basic settings] (基本設定)ビューを開きます。
  2. 一元管理されているHDFS接続を使用する場合は、[Property Type] (プロパティのタイプ)リストボックスをクリックして[Repository] (リポジトリー)を選択します。次に、[...]ボタンをクリックして[Repository Content] (リポジトリーのコンテンツ)ダイアログボックスを開きます。
  3. HCatalogデータベースへの接続用に定義されているHCatalog接続を選択し、[OK]をクリックします。

    該当するフィールドに、接続情報がすべて自動的に入力されます。

  4. [Schema] (スキーマ)リストボックスをクリックし、[Repository] (リポジトリー)を選択します。次に、フィールドのとなりの[...]ボタンをクリックして[Repository Content] (リポジトリーのコンテンツ)ダイアログボックスを開き、[Metadata] (メタデータ) > [Generic schemas] (汎用スキーマ) > access_logの順に展開して、スキーマを選択します。[OK]をクリックして選択したオプションを確定し、ダイアログボックスを閉じます。access_logの汎用スキーマが、コンポーネントに自動的に適用されます。

    また、[Repository] (リポジトリ)ツリービューでaccess_logの汎用スキーマを直接選択し、このコンポーネントにドラッグアンドドロップして適用することもできます。

  5. tLogRowコンポーネントの[Basic settings] (基本設定)ビューで、[Vertical] (縦)モードを選択して、ジョブの実行時、各行にキーと値を表示します。
  6. このコンポーネントの設定が終わったら、Ctrl+Sを押してジョブの設定を保存します。