Cloudera Navigatorでデータ来歴を定義
MapReduceまたはApache Sparkのバッチジョブの実行にCloudera V5.5+を使用している場合は、Cloudera Navigatorを活用して特定のデータフローの来歴を追跡し、ジョブによりこのデータフローがどのように生成されたかを調べることができます。
この来歴には、コンポーネント間でのこのジョブとスキーマの変更に使用されたコンポーネントが含まれています。
このタイプのジョブは、ビッグデータ対応のTalend製品のいずれか、Talend Data Fabricにサブスクライブしている場合にだけ使用できます。
手順
設定ビュー、すなわち、MapReduceジョブの[Run] (実行)タブの[Hadoop configuration] (Hadoop設定)ビュー、およびSpark Batchジョブの[Run] (実行)タブの[Spark configuration] (Spark設定)ビューで、[Use Cloudera Navigator] (Cloudera Navigatorの使用)チェックボックスをオンにします。
このオプションを有効にしたら、以下のパラメーターを設定する必要があります。
タスクの結果
このジョブを実行する時は、Cloudera Navigator内に来歴が自動的に生成されています。
ジョブの実行が完了したら、このジョブによって書かれたデータをCloudera Navigatorで検索し、Cloudera Navigatorでこのデータの来歴を確認します。
このページは役に立ちましたか?
このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。