1番目のジョブの作成 - 7.2

ビッグデータジョブの例

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > ジョブデザイン
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション
ジョブデザインと開発 > ジョブデザイン > ジョブフレームワーク > 標準ジョブ
次の手順に従って1番目のジョブを作成します。このジョブは、分析するアクセスログファイルを管理するためにHCatalogデータベースをセットアップします。

手順

  1. [Repository] (リポジトリー)ツリービューで、[Job Designs] (ジョブのデザイン)ノードを展開し、[Standard Jobs] (標準ジョブ)を右クリックして、[Create folder] (フォルダーの作成)を選択し、これから作成するジョブをまとめる新しいフォルダーを作成します。
  2. [Repository] (リポジトリー)ツリービューで[Job Designs] (ジョブのデザイン)を右クリックし、[Create folder] (フォルダーの作成)を選択し、これから作成するジョブをまとめる新しいフォルダーを作成します。
  3. 作成したフォルダーを右クリックし、[Create job] (ジョブの作成)を選択して1番目のジョブを作成します。サンプルジョブの役割と実行順序がわかるように、このジョブにA_HCatalog_Createという名前を付けます。

    ジョブに短い説明を追加することもできます。この説明は、ジョブの上にマウスポインターを当てた時にツールヒントとして表示されます。

  4. [Palette] (パレット)からデザインワークスペースにtHDFSDeleteコンポーネントと2つのtHCatalogOperationコンポーネントをドロップします。
  5. これらの3つのコンポーネントを[Trigger] (トリガー) > [On Subjob Ok] (サブジョブがOKの場合)接続でリンクします。

    HDFSサブジョブは、このデモサンプルから以前の結果を削除して(以前の結果がある場合)、ジョブの実行エラーを防ぎます。2つのHCatalogサブジョブは、HCatalogデータベースを作成し、HCatalogテーブルをセットアップし、生成されたHCatalogテーブルのパーティショニングを行います。

  6. これらのコンポーネントに、その機能が推測できるようなラベルを付けます。