クオリティバーの操作 - 7.0

Talend Data Preparation入門ガイド

EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Data Preparation
task
データクオリティとプレパレーション > データクレンジング

正しくないデータを特定するための最速の方法は、クオリティバーを使用することです。

各カラムの下には品質バーがあり、正しいデータ、正しくないデータ、または空のフィールドのあるフィールドの数を表示します。各カテゴリーは色別になっています。

  • 緑は、セルの形式に一致するデータです。
  • 白は空のセルです。
  • オレンジは、セルの形式に一致しないデータです。

任意の色をクリックして、無効な形式のデータのセルを選択、削除、または消去します。色にマウスを重ねると、各カテゴリの正確な行数、およびカラムの行数を表すパーセンテージが表示されます。

Emailカラムヘッダー下のクオリティバーを見ると、空のセルとデータの誤った値があることが確認できます。これらは削除します。

クオリティバーを使って、誤ったセルを含んだ行を削除するには、次の手順を実行します。

手順

  1. Emailカラムのヘッダーにあるクオリティバーの白い部分をクリックします。

    ドロップダウンメニューが開きます。

  2. [Delete the rows with empty cell] (空のセルを含む行を削除)をクリックします。

    Emailカラムの空のセルが削除され、オレンジのバーで示された無効な値だけが残ります。

  3. 最後の2つのステップを繰り返します。ただし今度は、クオリティバーのオレンジの部分をクリックして、[Delete the rows with invalid cells] (無効なセルのある行を削除)を選択します。

    Emailカラムから無効なデータまたは空のセルがすべて消去されました。

  4. クオリティバーを使って、Zip (郵便番号)カラムとPhone (電話番号)カラムから無効なセルを削除します。

タスクの結果

無効なデータのカラムで唯一残っているのはState (州)になりましたが、こちらは別の方法で処理します。