データ来歴は、データ送信先(出力コンポーネント)からさまざまなコンポーネントやステージを経てデータソース(入力コンポーネント)に至るデータフローを示します。データ来歴の結果は、データに実行される操作を含めて、異なるコンポーネント間のデータフローのライフサイクルをトレースします。
下に示す例は、[Repository] (リポジトリー)ツリービュー内の[Metadata] (メタデータ)ノードの下に格納されているデータベース接続項目に対して行われたデータ来歴を示します。
メタデータ項目でデータ来歴を開始するには、次の手順に従います。
手順
-
[Repository] (リポジトリー)ツリービュー内で[Metadata] (メタデータ) > [Db Connection] (データベース接続)を展開し、分析するデータベース接続を展開します。このサンプルではmysqlです。
-
データフローのライフサイクルを分析する一元管理されたテーブルスキーマを右クリックします。この例では[employees] (従業員)です。
[Impact Analysis] (インパクト分析)ビューに、選択したテーブルスキーマを使用するジョブが表示されます。該当するフィールドに、選択したデータベース接続とテーブルスキーマの名前が表示されます。
-
データ送信先(出力コンポーネント)からさまざまなコンポーネントやステージを経てデータソース(入力コンポーネント)に至るデータフローを分析するカラム名を[Column] (カラム) リストから選択します。この例で分析するカラムは、[Name] (名前)と呼ばれます。
[Repository] (リポジトリー)ツリービューでNameカラムを右クリックして、コンテキストメニューから[Impact Analysis] (インパクト分析)を選択すると、このステップをスキップできます。
-
[Data Lineage] (データ来歴)をクリックします。
分析操作の進行状況を示すバーが表示され、分析結果がビューに表示されます。
-
リストされているジョブを右クリックし、コンテキストメニューから[Open Job] (ジョブを開く)を選択します。
ジョブがデザインワークスペース内に開かれます。
データ来歴の結果は、出力カラムのNameのデータが、このカラムに書き込まれる前に通過するコンポーネントや変換を逆方向にトレースします。