データセットのクオリティ - Cloud

Talend Cloud Data Preparationユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
EnrichPlatform
Talend Data Preparation

視覚的なインジケーターをいくつか使えば、データのクオリティを正確に把握できます。

クオリティインジケーターを使用すると、サンプルレベルとレコードレベルにおいて、迅速かつ簡単に情報のクオリティを評価できます。アプリケーションでは、カラムで自動検出されたセマンティックに基づき、次のカラーコードを使用してデータを空、有効、無効のいずれかに分類できます。

  • 緑はカラムの形式に一致するデータです。
  • オレンジはカラムの形式に一致しないデータです。
  • 黒は空のセルです。

クオリティインジケーターは、以下の場所に示されています。

  • データセットリストから:

    データセットのクオリティは、クオリティバーの形式で表示されます。色の上にマウスを移動させると、データセットのクオリティ統計が表示されます。サンプルで空、無効、正しくない値の割合と正確な数が表示されます。

  • データセット概要から:

    データセット概要の[Data quality] (データセットのクオリティ)タイルには、データセットサンプル全体での空の値、有効値、無効値の正確な割合と数が円グラフで表示されます。各カテゴリーは、専用の円グラフに表示されます。

  • データセットサンプルヘッダーから:

    データセットの上のヘッダーには、データセットサンプル全体における空の値、有効値、無効値の再区分を示す円グラフもあります。各カテゴリーは、専用の円グラフに表示されます。詳細な統計情報を参照するには、グラフにマウスを重ねます。

  • クオリティバーから:

    データセットのグリッドビューを使用する場合、各カラムヘッダーにクオリティバーが表示されます。ここに表示される統計は、それぞれ特定のカラムに適用されます。各カテゴリーの詳細な統計情報を示す色の上でマウスオーバーします。グリッドビューの場合、カラムのセマンティックタイプに基づいて無効である値を含むセルは、左側の境界線がオレンジ色で表示されます。