クオリティバーでの作業 - Cloud

Talend Cloud Data Preparation入門ガイド

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Preparation
task
データクオリティとプレパレーション > データクレンジング

正しくないデータを特定するための最速の方法は、クオリティバーを使用することです。

各カラムの下にはクオリティバーがあり、正しいデータ、正しくないデータ、空のフィールドがあるフィールドの数を表示します。各カテゴリーは色別になっています。

  • 緑は、セルの形式に一致するデータです
  • グレーは空のセルです
  • オレンジは、セルの形式に一致しないデータです。

任意の色をクリックして、無効な形式のデータのセルを選択、削除、または消去します。色にマウスを重ねると、各カテゴリーの正確な行数、およびカラムの行数を表すパーセンテージが表示されます。

[Email] (メール)カラムヘッダー下のクオリティバーを見ると、空のセルとデータの誤った値があることが確認できます。これらは削除します。

クオリティバーを使って、誤ったセルを含んだ行を削除するには、次の手順を実行します。

手順

  1. [Email] (メール)カラムのヘッダーにあるクオリティバーのグレーの部分をクリックします。
    ドロップダウンメニューが開きます。
  2. [Delete the rows with empty cells] (空のセルのある行を削除)をクリックします。
    Emailカラムの空のセルが削除され、オレンジのバーで示された無効な値だけが残ります。
  3. 最後の2つのステップを繰り返します。ただし今度は、クオリティバーのオレンジの部分をクリックして、[Delete the rows with invalid cells] (無効なセルのある行を削除)を選択します。
    Emailカラムから無効なデータまたは空のセルがすべて消去されました。
  4. クオリティバーを使って、[Zip] (郵便番号)カラムと[Phone] (電話番号)カラムから無効なセルを削除します。

タスクの結果

無効なデータのカラムで残っているのは[State] (州)のみになりましたが、こちらは別の方法で処理します。