データ来歴 - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

データ来歴は、データ送信先(出力コンポーネント)からさまざまなコンポーネントやステージを経てデータソース(入力コンポーネント)に至るデータフローを示します。データ来歴の結果は、データに実行されるオペレーションを含めて、異なるコンポーネント間のデータフローのライフサイクルをトレースします。

Talend Studioを使用すると、データ来歴の結果をHTMLおよびXMLの詳細ドキュメンテーションとして出力できます。詳細は、影響分析/データ来歴の結果をHTMLにエクスポートするおよび影響分析/データ来歴の結果をXMLにエクスポートするを参照して下さい。

警告: 影響分析またはデータ来歴を実行する全てのアイテムは、以下のノードのいずれかの下にある[Repository] (リポジトリー)ツリービュー内で一元管理する必要があります: [Joblets Designs] (ジョブレットデザイン)[Contexts] (コンテキスト)[SQL Templates] (SQLテンプレート)[Reference project] (参照プロジェクト)、または[Metadata] (メタデータ)

下に示す例は、[Repository] (リポジトリー)ツリービュー内の[Metadata] (メタデータ)ノードの下に保管されているデータベース接続アイテムに対して行われたデータ来歴を示します。

メタデータアイテムでデータ来歴を開始するには、以下のようにします:

手順

  1. [Repository] (リポジトリー)ツリービュー内で[Metadata] > [DB Connection] (DB接続)を展開し、分析するデータベース接続を展開します。この例では[mysql]です。
  2. データフローのライフサイクルを分析する一元管理されたテーブルスキーマを右クリックします。この例では[employees] (従業員)です。
    [Impact Analysis] (影響分析)ビューに、選択したテーブルスキーマを使用するジョブが表示されます。対応するフィールドに選択したデータベース接続とテーブルスキーマの名前が表示されます。
  3. データ送信先(出力コンポーネント)からさまざまなコンポーネントやステージを経てデータソース(入力コンポーネント)に至るデータフローを分析するカラム名を[Column] (カラム) リストから選択します。この例で分析対象となるカラムは、[Name] (名前)と呼ばれます。
    [Repository] (リポジトリー)ツリービューで[Name] (名前)カラムを右クリックして、コンテキストメニューから[Impact Analysis] (影響分析)を選択すると、このステップをスキップできます。
  4. [Data Lineage] (データ来歴)をクリックします。
    分析オペレーションの進行状況を示すバーが表示され、分析結果がビューに表示されます。
  5. リストされているジョブを右クリックし、コンテキストメニューから[Open Job] (ジョブを開く)を選択します。
    ジョブがデザインワークスペース内に開かれます。
    データ来歴の結果は、出力カラムの[Name] (名前)のデータが、このカラムに書き込まれる前に通過するコンポーネントや変換を逆方向にトレースします。