レポートファイルの生成 - 7.3

Talend Big Data Platform Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発

レポートファイルは、[DQ Repository] (DQリポジトリー)ツリービューまたは開いているレポートエディターから生成できます。

Studio内からどちらの方法でレポートを生成しても、リポジトリーの分析の概要が必ず更新されます。ただし、レポートエディターで、[Refresh] (更新)および[Refresh All] (すべて更新)チェックボックスが選択されている必要があります。詳細は、新規レポートの作成を参照してください。

警告: レポートデータベースと現在のStudioのバージョンが異なる場合、レポートファイルを生成しようとすると、レポートデータベースを移行するよう警告するメッセージが表示されます。詳細は、遠隔データベースの移行を参照してください。

前提条件:

StudioのProfilingパースペクティブでレポートファイルが作成されていること。詳細は、新規レポートの作成を参照してください。

[Generated Report Settings] (生成レポートの設定)ビューで[Generate output file] (出力ファイルの生成) チェックボックスが選択されていること。

レポートエディターからレポートファイルを生成するには、以下のようにします:

  1. [DQ Repository] (DQリポジトリー)ツリービューで、生成するレポートファイルをダブルクリックします。

    レポートエディターで選択されたレポートが表示されます。

  2. レポートエディターのツールバーから、をクリックします。

    レポートエディターにリスト表示され、更新用にマークされているそれぞれの分析が実行されます。リポジトリーで分析の概要が更新され、分析結果はレポートデータベース(データマート)の履歴に記録されて、最終的にレポート(pdf、html、xsl、またはxml形式)が生成されます。

    生成されたレポートは、[DQ Repository] (DQリポジトリー)ツリービューの[Generated Document] (生成ドキュメント)フォルダーの下にリスト表示されます。

    このレポートドキュメントは、共有リポジトリーをホスティングし、以下の場合にすべてのチームメンバー間で共有する、SVNまたはGitサーバー上でコミットされます:

    それ以外の場合、レポートファイルは定義されたフォルダーに保存されますが、SVNまたはGitサーバーではコミットされません。

  3. 生成されたドキュメントをダブルクリックして、レポートファイルを開きます。

    以下は、生成された.pdfレポートファイルの例です。このレポートには、選択されたレポートでリスト表示されたすべての分析の結果が表示されます。

    このレポートでは、テーブル分析の結果が示されます。ここでは定義されたSQLビジネスルールに対して年齢のレコードが評価されます。詳細は、SQLビジネスルールによるテーブル分析の作成を参照してください。

    このレポートには、[email] (メール)カラムのパターン低頻度統計が示されます。詳細は、分析するカラムの定義とインジケーターの設定を参照してください。

    テーブル内のパターンでは、[email] (メール)の値を表すのにaAを使用します。各パターンには30文字まで使用できます。文字の合計数が30を超えると、パターンは次のように表されます: aaaaaAAAAAaaaaaAAAAAaaaaaAAAAA...<合計文字数>

    このレポートでは、特定のカラムのレコード数に関するシンプル統計が提供されます。詳細は、分析するカラムの定義とインジケーターの設定を参照してください。

    カラム分析結果の表で、インジケーターの値が赤で表示されている場合、これは、カラム分析エディターのインジケーターにしきい値が設定されており、このしきい値に違反していることを意味します。データのしきい値の詳細は、システムまたはユーザー定義インジケーターのオプション設定を参照してください。

    また、[Indicator OK] (インジケーターOK)カラムの結果表の値の詳細は、次のとおりです。

    説明

    N

    しきい値がカラム分析のインジケーターに設定されているが、インジケーターはこのデータのしきい値を考慮していない。

    有効

    しきい値がカラム分析のインジケーターに設定されており、インジケーターはこのデータのしきい値を考慮している。

    N/A

    インジケーターにしきい値が設定されていない。

    このレポートには、2つの異なるテーブルの2つの同一のカラムを比較した結果が示されます。詳細は、異なるテーブルにある同一カラムの比較を参照してください。

    このレポートでは、決定エレメントカラムの値が、依存カラムの別の値にどの程度機能的に決定力があるかを検出します。[%Match] (%一致)に返された結果は、各決定エレメントカラムの機能的な依存項目の強さを示します。一致しないレコードは、赤で表示されます。詳細は、カラム内の異常の検出(機能的な依存項目の分析)を参照してください。

    このレポートは、[Benford Law] (ベンフォードの法則)インジケーターに対し、数値カラムの分析を通じて不正なデータの可能性のあるケースを示します。詳細は、不正の検出を参照してください。

レポートエディターを開かずにレポートファイルを生成するには、次を実行します。

  1. [DQ Repository] (DQリポジトリー)ツリービューでレポートを右クリックして、コンテキストメニューから[Run report] (レポートの実行)を選択します。

    複数のレポートのファイルを同時に生成するには、それらのレポートを選択して右クリックし、[Run report] (レポートの実行)をクリックします。ただし、レポート結果の保存にHSQLデータベースを使用する場合、レポートの実行は1回に1つずつになります。

    操作が進行中であることを示すメッセージがステータスバーに表示されます。選択したレポートのファイルが生成され、[DQ Repository] (DQリポジトリー)ツリービューの[Generated Document] (生成ドキュメント)フォルダーに保存されます。

    選択したレポートのレポートエディターにリスト表示され、更新するようマークされているそれぞれの分析が実行されます。リポジトリーで分析の概要が更新され、分析結果はレポートデータベース(データマート)の履歴に記録されて、最終的にレポート(pdf、html、xsl、またはxml形式)が生成されます。

    このレポートドキュメントは、共有リポジトリーをホスティングし、以下の場合にすべてのチームメンバー間で共有する、SVNまたはGitサーバー上でコミットされます:

    それ以外の場合は、レポートファイルは定義されたフォルダーに保存されますが、SVNまたはGitサーバーでコミットされません。