クオリティバーでの作業 - Cloud

Talend Cloud Data Preparation入門ガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2024-03-11

正しくないデータを特定するための最速の方法は、クオリティバーを使用することです。

各カラムの下にはクオリティバーがあり、正しいデータ、正しくないデータ、または空のフィールドのあるフィールドの数を表示します。各カテゴリーは色別になっています。

  • 緑はセルの形式に一致するデータです
  • グレーは空のセルです
  • 赤はセルの形式に一致しないデータです

任意の色をクリックして、無効な形式のデータのセルを選択、削除、消去します。色にマウスを重ねると、各カテゴリーの正確な行数、およびカラムの行数を表すパーセンテージが表示されます。

Emailカラムヘッダー下のクオリティバーを見ると、空のセルとデータの誤った値があることが確認できます。これらは削除します。

Emailカラムの下にクオリティバーが表示されている状態。グレーの部分はセルが空であることを示し、赤の部分は値が正しくないことを示す。

クオリティバーを使って、誤ったセルを含んだ行を削除するには、次の手順を実行します。

手順

  1. Emailカラムのヘッダーにあるクオリティバーのグレーの部分をクリックします。
    ドロップダウンメニューが開きます。
    Emailカラムのグレー部分のドロップダウン。
  2. [Delete the rows with empty cells] (空のセルのある行を削除)をクリックします。
    Emailカラムの空のセルが削除され、赤のバーで示された無効な値だけが残ります。
    Emailカラムに無効な値のみが残っている状態。
  3. 最後の2つのステップを繰り返します。ただし今回はクオリティバーの赤の部分をクリックし、[Delete the rows with invalid cells] (無効なセルのある行を削除)を選択します。
    Emailカラムから無効なデータまたは空のセルがすべて消去されました。
    Emailカラムに有効な値飲みが残っている状態。
  4. クオリティバーを使って、[Zip] (郵便番号)カラムと[Phone] (電話番号)カラムから無効なセルを削除します。

タスクの結果

無効なデータのカラムで残っているのは[State] (州)のみになりましたが、こちらは別の方法で処理します。