1つ目のジョブの作成 - 7.0

ビッグデータジョブのサンプル

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > ジョブデザイン
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション
ジョブデザインと開発 > ジョブデザイン > ジョブフレームワーク > 標準ジョブ
次の手順に従って1つ目のジョブを作成します。このジョブは、分析するアクセスログファイルを管理するためにHCatalogデータベースをセットアップします。

手順

  1. [Repository] (リポジトリ)ツリービューで、[Job Designs] (ジョブのデザイン)ノードを展開し、[Standard Jobs] (標準ジョブ)を右クリックして、[Create folder] (フォルダーの作成)を選択し、これから作成するジョブをまとめる新しいフォルダーを作成します。
  2. [Repository] (リポジトリ)ツリービューで[Job Designs] (ジョブのデザイン)を右クリックし、[Create folder] (フォルダーの作成)を選択し、これから作成するジョブをまとめる新しいフォルダーを作成します。
  3. 作成したフォルダーを右クリックし、[Create job] (ジョブの作成)を選択して1つ目のジョブを作成します。サンプルジョブの役割と実行順序がわかるように、このジョブにA_HCatalog_Createという名前を付けます。

    ジョブに短い説明を追加することもできます。この説明は、ジョブの上にマウスポインターを当てたときにツールヒントとして表示されます。

  4. [Palette] (パレット)からデザインワークスペースにtHDFSDeleteコンポーネントと2つのtHCatalogOperationコンポーネントをドロップします。
  5. これらの3つのコンポーネントを[Trigger] (トリガー) > [On Subjob Ok] (サブジョブがOKの場合)接続でリンクします。

    HDFSサブジョブは、このデモサンプルから以前の結果を削除して(以前の結果がある場合)、ジョブの実行エラーを防ぎます。2つのHCatalogサブジョブは、HCatalogデータベースを作成し、HCatalogテーブルをセットアップし、生成されたHCatalogテーブルのパーティショニングを行います。

  6. これらのコンポーネントに、その機能が推測できるようなラベルを付けます。