レポートファイルの生成 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

レポートファイルは、[DQ Repository] (DQリポジトリ)ツリービューまたは開いているレポートエディターから生成できます。

Studio内からどちらの方法でレポートを生成しても、リポジトリの分析の概要が必ず更新されます。ただし、レポートエディターで、[Refresh] (更新)および[Refresh All] (すべて更新)チェックボックスが選択されている必要があります。詳細は、新規レポートの作成を参照して下さい。

警告: レポートデータベースと現在のStudioのバージョンが異なる場合、レポートファイルを生成しようとすると、レポートデータベースを移行するよう警告するメッセージが表示されます。詳細は、遠隔データベースの移行を参照して下さい。

前提条件:

StudioのProfilingパースペクティブでレポートファイルが作成されていること。詳細は、新規レポートの作成を参照して下さい。

[Generated Report Settings] (生成レポートの設定)ビューで[Generate output file] (出力ファイルの生成)チェックボックスがオンになっていること。

レポートエディターからレポートファイルを生成するには、次の手順に従います。

  1. [DQ Repository] (DQリポジトリ)ツリービューで、生成するレポートファイルをダブルクリックします。

    レポートエディターで選択されたレポートが表示されます。

  2. レポートエディターのツールバーから、をクリックします。

    レポートエディターにリストされ、更新用にマークされているそれぞれの分析が実行されます。リポジトリで分析の概要が更新され、分析結果はレポートデータベース(データマート)の履歴に記録されて、最終的にレポート(pdf、html、xsl、またはxml形式)が生成されます。

    生成されたレポートは、[DQ Repository] (DQリポジトリ)ツリービューの[Generated Document] (生成ドキュメント)フォルダーの下にリストされます。

    このレポートドキュメントは、以下の場合に、共有リポジトリをホストするSVNまたはGitサーバーでコミットされ、チームメンバー全員で共有されます。

    それ以外の場合は、レポートドキュメントは定義されたフォルダーに保存されますが、SVNまたはGitサーバーでコミットされません。

  3. 生成されたドキュメントをダブルクリックして、レポートファイルを開きます。

    以下は、生成された.pdfレポートファイルの例です。このレポートには、選択されたレポートでリストされたすべての分析の結果が表示されます。

    このレポートでは、テーブル分析の結果が示されます。ここでは定義されたSQLビジネスルールに対して年齢のレコードが評価されます。詳細は、SQLビジネスルールを持つテーブル分析を作成する方法を参照して下さい。

    このレポートには、[email] (電子メール)カラムのパターン低頻度統計が示されます。詳細は、分析するカラムの定義とインジケーターの設定を参照して下さい。

    テーブル内のパターンでは、[email] (電子メール)の値を表すのにaAを使用します。各パターンには30文字まで使用できます。文字の合計数が30を超えると、パターンは次のように表されます: aaaaaAAAAAaaaaaAAAAAaaaaaAAAAA...<文字の合計数>

    このレポートでは、特定のカラムのレコード数に関するシンプル統計が提供されます。詳細は、分析するカラムの定義とインジケーターの設定を参照して下さい。

    カラム分析結果の表で、インジケーターの値が赤で表示されている場合、これは、カラム分析エディターのインジケーターにスレッショルドが設定されており、このスレッショルドに違反していることを意味します。データのスレッショルドの詳細は、システムまたはユーザー定義インジケーターのオプション設定を参照して下さい。

    また、[Indicator OK] (インジケーターOK)カラムの結果表の値の詳細は、次のとおりです。

    説明

    N

    スレッショルドがカラム分析のインジケーターに設定されているが、インジケーターはこのデータのスレッショルドを考慮していない。

    Y

    スレッショルドがカラム分析のインジケーターに設定されており、インジケーターはこのデータのスレッショルドを考慮している。

    N/A

    インジケーターにスレッショルドが設定されていない。

    このレポートには、2つの異なるテーブルの2つの同一のカラムを比較した結果が示されます。詳細は、異なるテーブルにある同一カラムの比較を参照して下さい。

    このレポートでは、決定要素カラムの値が、依存カラムの別の値にどの程度機能的に決定力があるかを検出します。[%Match] (%一致)に返された結果は、各決定要素カラムの機能的な依存性の強さを示します。一致しないレコードは、赤で表示されます。詳細は、カラム内の異常の検出(機能的な依存性の分析)を参照して下さい。

    このレポートは、[Benford Law ] (ベンフォードの法則)インジケーターに対し、数値カラムの分析を通じて不正なデータの可能性のあるケースを示します。詳細は、不正の検出を参照して下さい。

レポートエディターを開かずにレポートファイルを生成するには、次を実行します。

  1. [DQ Repository] (DQリポジトリ)ツリービューでレポートを右クリックして、コンテキストメニューから[Run report] (レポートの実行)を選択します。

    複数のレポートのファイルを同時に生成するには、それらのレポートを選択して右クリックし、[Run report] (レポートの実行)をクリックします。ただし、レポート結果の保存にHSQLデータベースを使用する場合、レポートの実行は1度に1つずつになります。

    操作が進行中であることを示すメッセージがステータスバーに表示されます。選択したレポートのファイルが生成され、[DQ Repository] (DQリポジトリ)ツリービューの[Generated Document] (生成ドキュメント)フォルダーに保存されます。

    選択したレポートのレポートエディターにリストされ、更新するようマークされているそれぞれの分析が実行されます。リポジトリで分析の概要が更新され、分析結果はレポートデータベース(データマート)の履歴に記録されて、最終的にレポート(pdf、html、xsl、またはxml形式)が生成されます。

    このレポートドキュメントは、以下の場合に、共有リポジトリをホストするSVNまたはGitサーバーでコミットされ、チームメンバー全員で共有されます。

    それ以外の場合は、レポートファイルは定義されたフォルダーに保存されますが、SVNまたはGitサーバーでコミットされません。