Talend Studioからのレポートファイルの生成 - 7.3

Data Qualityジョブと分析の例

EnrichVersion
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
データクオリティとプレパレーション

Talend DQ PortalTalend 7.1以降、非推奨となっています。

手順

  1. [DQ Repository] (DQリポジトリ)ツリービューで分析名を右クリックし、[New Report] (新規レポート)を選択します。

    レポートエディターが開き、選択した分析が[Analysis List] (分析リスト)に表示されます。

  2. [Analysis list] (分析リスト)ビューおよび[Template type] (テンプレートタイプ)リストで、生成するレポートのタイプとして[Evolution] (進展)を選択します。
    この例では進展レポートを生成します。このレポートは、emailカラムとpostalカラムに使用されるインジケーターの時間の経過に伴う進展に関する情報を提供します。このレポートを使用して、現在と履歴の統計を比較し、アドレスデータのクオリティの向上または劣化を判断できます。適切なタイミングでデータに介入して問題を解決したり、継続的にデータクオリティを監視するためには、このような情報が極めて重要です。
  3. レポートを生成する前に、[Refresh All] (すべて更新)チェックボックスを選択して表示された分析を更新します。
  4. [Generated Report Settings] (生成レポートの設定)ビューの[File Type] (ファイルタイプ)リストから、PDFレポートファイルの生成を選択します。
  5. [Database Connection Settings] (データベース接続設定)ビューで、レポート結果を保存するデータマートへの接続パラメーターを設定します。
  6. 接続が正常に行われたかどうかを確認するには、[Check] (チェック)ボタンをクリックします。
    データベースが存在するかどうか、接続が正常に行われたかどうかを示すメッセージが表示されます。
  7. データベース構造が存在しない場合、メッセージの[OK]をクリックし、Talend Studioで自動作成します。
  8. [OK]をクリックして、確認のメッセージを閉じます。
  9. レポートを保存し、エディターのツールバーにあるをクリックしてレポートファイルを生成します。

タスクの結果

レポートファイルが生成され、[DQ Repository] (DQリポジトリ)ツリービューの[Reports] (レポート)ノードの下に表示されます。このレポートは、emailカラムとpostalカラムに使用される単純統計用のインジケーターとパターンの時間の経過に伴う進展を示します。

次に示すのはemailカラムの結果です。

このグラフは現在電子メールアドレスの89.80%が有効であることを示しています。

進展レポートには2つのグラフがあります。1つは統計の変化を示し、もう1つはその変化の割合を示します。

このレポートを繰り返し生成すると、データに変化がない場合、水平な線が示されます。データが修正されるとこの線は右上がりになり、データの正確さと一貫性が失われるとこの線は右下がりになります。

レポートの詳細は、Talend Studioユーザーガイドの[Reports] (レポート)の章を参照してください。

Talend Studioでこのレポートを生成した後、ビジネスユーザーはこのレポートにTalend DQ Portalからアクセスできます。