ジョブの設定で再利用できるようアクセスログファイルのスキーマを一元管理 - 7.2

ビッグデータジョブの例

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > ジョブデザイン
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション
ジョブデザインと開発 > ジョブデザイン > ジョブフレームワーク > 標準ジョブ

分析対象のアクセスログファイルをHadoopシステムで処理するには、該当するコンポーネントに適切なスキーマを定義する必要があります。

設定を簡易化するため、ジョブの設定を開始する前に、tApacheLogInputコンポーネントの読み取り専用スキーマを、複数のジョブで再利用できる汎用スキーマとして保存できます。

手順

  1. B_HCatalog_Readジョブで、tApacheLogInputコンポーネントをダブルクリックし、[Basic settings] (基本設定)ビューを開きます。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、[Schema] (スキーマ)ダイアログボックスを開きます。
  3. ボタンをクリックして、[Select folder] (フォルダーの選択)ダイアログボックスを開きます。
  4. ここでは、まだ[Generic schemas] (汎用スキーマ)ノードの下にフォルダーを作成していないので、[OK]をクリックしてダイアログボックスを閉じ、汎用スキーマの設定ウィザードを開きます。
  5. この例では、汎用スキーマにaccess_logという名前を付け、[Finish] (完了)をクリックしてウィザードを閉じ、スキーマを保存します。
  6. [OK]をクリックして[Schema] (スキーマ)ダイアログボックスを閉じます。これで、汎用スキーマが[Repository] (リポジトリー)ビューの[Generic schemas] (汎用スキーマ)ノード下に表示され、ジョブの設定で必要な時にいつでも使用できるようになります。