ジョブの設定で再利用するためにアクセスログファイルのスキーマを一元管理 - 7.0

ビッグデータジョブのサンプル

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > ジョブデザイン
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション
ジョブデザインと開発 > ジョブデザイン > ジョブフレームワーク > 標準ジョブ

分析対象のアクセスログファイルをHadoopシステムで処理するには、該当するコンポーネントに適切なスキーマを定義する必要があります。

設定を簡易化するため、ジョブの設定を開始する前に、tApacheLogInputコンポーネントの読み取り専用スキーマを、複数のジョブで再利用できる汎用スキーマとして保存することができます。

手順

  1. B_HCatalog_Readジョブで、tApacheLogInputコンポーネントをダブルクリックし、[Basic settings] (基本設定)ビューを開きます。
  2. [Edit schema] (スキーマの編集)の横にある[...]ボタンをクリックし、[Schema] (スキーマ)ダイアログボックスを開きます。
  3. ボタンをクリックして、[Select folder] (フォルダーの選択) ダイアログボックスを開きます。
  4. ここでは、まだ[Generic schemas] (汎用スキーマ)ノードの下にフォルダーを作成していないので、[OK]をクリックしてダイアログボックスを閉じ、汎用スキーマの設定ウィザードを開きます。
  5. この例では、汎用スキーマにaccess_logという名前を付け、[Finish] (完了)をクリックしてウィザードを閉じ、スキーマを保存します。
  6. [OK]をクリックして[Schema] (スキーマ)ダイアログボックスを閉じます。汎用スキーマが[Repository] (リポジトリ)ビューの[Generic schemas] (汎用スキーマ)ノード下に表示され、ジョブの設定で必要なときにいつでも使用できるようになりました。