クオリティバーでの作業 - 8.0

Talend Data Preparation入門ガイド

Version
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング

正しくないデータを特定するための最速の方法は、クオリティバーを使用することです。

各カラムの下にはクオリティバーがあり、正しいデータ、正しくないデータ、空のフィールドがあるフィールドの数を表示します。各カテゴリーは色別になっています。

  • 緑はセルの形式に一致するデータです。
  • 白は空のセルです。
  • オレンジはセルの形式に一致しないデータです。

任意の色をクリックして、無効な形式のデータのセルを選択、削除、または消去します。色にマウスを重ねると、各カテゴリーの正確な行数、およびカラムの行数を表すパーセンテージが表示されます。

[Email] (メール)カラムヘッダー下のクオリティバーを見ると、空のセルとデータの誤った値があることが確認できます。これらは削除します。

クオリティバーを使って、誤ったセルを含んだ行を削除するには、次の手順を実行します。

手順

  1. [Email] (メール)カラムのヘッダーにあるクオリティバーの白い部分をクリックします。

    ドロップダウンメニューが開きます。

  2. [Delete the rows with empty cell] (空のセルを含む行を削除)をクリックします。

    [Email] (メール)カラムの空のセルが削除され、オレンジのバーで示された無効な値だけが残ります。

  3. 最後の2つのステップを繰り返します。ただし今回はクオリティバーのオレンジの部分をクリックして、[Delete the rows with invalid cells] (無効なセルのある行を削除)を選択します。

    [Email] (メール)カラムから無効なデータまたは空のセルがすべて消去されました。

  4. クオリティバーを使って、[Zip] (郵便番号)カラムと[Phone] (電話番号)カラムから無効なセルを削除します。

タスクの結果

無効なデータのカラムで残っているのは[State] (州)のみになりましたが、こちらは別の方法で処理します。