パターンを使って値をフィルタリング - Cloud

Talend Cloud Data Preparationユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
Last publication date
2023-11-20
プロファイリングエリアの[Pattern] (パターン)タブには、データを構成する文字のタイプと数がグラフィカルに表現されています。

このタスクについて

このサンプルでは、名前、メール、会社名、サブスクリプションの日付など、標準的な顧客情報のデータセットを使用します。

手順

  1. フィルタリングしたいデータが含まれているカラム(emailなど)を選択します。
  2. プロファイリングエリアの[Pattern] (パターン)タブをクリックします。
    このカラムに使用されているさまざまなパターンが、チャート形式で表示されます。このカラムではtextデータが使用されるため、チャートには、単語ベースのパターンを使用したデータ配分が表示されます。
  3. [A]アイコンをクリックして文字ベースのビューに切り替えます。
    これにより、別の視点からデータを分析できます。
  4. [Text] (テキスト)アイコンをクリックして単語ベースのビューに戻します。
  5. 上のバーをクリックして、最も一般的なパターンにフィルターを適用します。

    これで、プレパレーションには[word]@[word].[word]形式の行のみが表示されます。

    Ctrl + クリックまたはShift + クリックで複数の値を同時に選択し、より複雑なフィルターを適用することもできます。

  6. [Ctrl]ボタンを押したまま、[word][number]@[word].[word]パターンに対応するバーをクリックして、このフィルターを前のフィルターに追加します。
    グリッドには、これらの2つのフィルターに合うデータだけが表示されます。
  7. ファンクションパネルで、Delete these Filtered Rowsなど、フィルター処理したデータに対して実行するファンクションをクリックします。
  8. フィルターバーで、各フィルターのX印をクリックするか、ごみ箱アイコンをクリックしてフィルターを消去し、再びデータセット全体を表示します。