データフロー来歴を追跡 - Cloud

Talend Cloud Data Catalogユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Catalog
Content
データガバナンス
Last publication date
2023-11-13
データフロー来歴機能によって、特定のオブジェクトを絞り込み、モデル、外部メタデータリポジトリー、設定内におけるそのようなオブジェクトの相関リレーションシップを表示できるようになります。 データフロー来歴は、データストアに対する接続定義と、データを変換および移動させる物理変換ルールに基づきます。
データフロー分析には次の3つのタイプがあります。
  • データ来歴は、データフローのアップストリームに適用されます。「その情報はどこから来たか」など、逆来歴に関する質問を参照します。
  • データインパクトは、データフローのダウンストリームに適用されます。「変更によって何が影響を受けるか」など、来歴の将来に関する質問を参照します。
  • 完全データ来歴は、データフローのアップストリームとダウンストリームの両方に適用されます。そして前の2つのタイプを同時に参照します。
[Data Flow] (データフロー)タブはユースケースやスコープによって使い分けることができます。
  • 分類子(テーブル、ファイル、エンティティなど)や機能(カラム、フィールド、属性など)から[Data Flow] (データフロー)タブまたはコンテキストメニューに移動し、来歴やインパクトのトレースを呼び出すと、現在の設定にあるモデルやマッピング全体でエンドツーエンドトレースが表示されます。
  • モデル、スキーマ、ETLジョブ、BIデザインなどの詳細ページから[Data Flow] (データフロー)タブに移動すると系統の概要が表示され、他のモデルにスティッチされていなくても、モデル内の来歴を表示できるようになります。

データフローの来歴トレースは、サマリー来歴を表示しています。データフローの概観来歴は対照的に、詳細な変換の来歴を表示しています。テーブルやカラムのインパクトや来歴を追跡するとき、変換がすべて見えるわけではありません。その代わり、ジョブ全体の概要が表示されます。

定数は来歴図に表示されません。定数が来歴のソースとして表示され、プロセスがその定数を来歴トレースのソースとしてしか持っていない場合は、来歴トレースにそのプロセスは表示されません。