一致する値のフィルタリング - Cloud

Talend Cloud Data Preparationの簡単な例

Version
Cloud
Language
日本語 (日本)
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング

正規表現に一致する行を知る方法がわかったので、新しいカラムでフィルターを作成すれば、該当する行をすべて取得できるようになります。

手順

  1. city_matchingカラムのヘッダーをクリックし、その内容を選択します。
    画面右下のデータプロファイリングエリアに、カラム内のtrue値とfalse値の出現数を示す横棒グラフがあります。正確な出現数を表示するには、各バーの上にマウスを置きます。
  2. フィルターを作成するには、trueバーをクリックします。
    フィルターバーを見ると、フィルターがデータセットに適用されたことがわかります。また、顧客データは正規表現で前に設定された条件に一致する場合のみ表示されます。

タスクの結果

いくつかの値に基づくこのフィルターによって、指定した都市の顧客に関係する売上を分離しました。ただし、探していた5つの値のうち検索されたのは4つだけで、データセットにはParisに関係する行がないようです。そこで、このフィルターが現在のサンプルよりも多くの行に一致する可能性があるかどうかこれから確認してみます。