データクオリティの動作原理 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio
ProfilingTalend Studioパースペクティブから、さまざまなデータソースで利用できるデータを検証し、そのデータに関する統計と情報を収集できます。

Talend Studioでのデータプロファイリングは、通常、次の順序で行われます。

  1. 分析を定義して実行するテーブルとカラムにアクセスするために、データベース、区切り記号付きファイルなどのデータソースに接続する。詳細は、『データソースへの接続の作成』を参照して下さい。
  2. 利用可能なデータクオリティ分析を定義する。これには、データベースコンテンツの分析、カラム分析、テーブル分析、冗長性分析、コリレーション分析などがあります。これらの分析により、コンテンツ、構造、および極めて複雑なデータ構造のクオリティを定義するデータプロファイリングプロセスが実行されます。分析結果は、各分析エディターのとなりにグラフィックで表示されるか、[Analysis Results] (分析結果)ビューでより詳細に表示されます。
    注: データベースのデータのプロファイリングには、全ての分析タイプを使用できますが、区切り記号付きファイルのデータプロファイリングに使用できるのはカラム分析カラムセット分析のみです。