データクオリティの動作原理 - Cloud

Talend Cloud API Services Platform Studio ユーザーガイド

Version
Cloud
Language
日本語 (日本)
EnrichDitaval
API Services Platform
Product
Talend Cloud
Module
Talend Studio
Content
ジョブデザインと開発
Talend StudioProfilingパースペクティブから、さまざまなデータソースで利用できるデータを検証し、そのデータに関する統計と情報を収集できます。

Talend Studioでのデータプロファイリングは、通常、次の順序で行われます。

  1. 分析を定義して実行するテーブルとカラムにアクセスするために、データベース、区切り付きファイルなどのデータソースに接続する。詳細は、データソースへの接続の作成をご覧ください。
  2. 利用可能なデータクオリティ分析を定義する。これには、データベースコンテンツの分析、カラム分析、テーブル分析、冗長性分析、コリレーション分析などがあります。これらの分析により、コンテンツ、構造、および極めて複雑なデータ構造のクオリティを定義するデータプロファイリングプロセスが実行されます。分析結果は、各分析エディターの横にグラフィックで表示されるか、[Analysis Results] (分析結果)ビューでより詳細に表示されます。
    注: データベースのデータのプロファイリングには、すべての分析タイプを使用できますが、区切り付きファイルのデータプロファイリングに使用できるのはカラム分析カラムセット分析のみです。