値を手動でフィルタリング - 8.0

Talend Data Preparationユーザーガイド

Version
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2024-03-26

データセットに含まれているデータからより具体的なアイディアを得る、またはデータの特定のサブセットでファンクションを実行できるようにするため、データにフィルターを作成します。

この例では、名前、年齢、メール、または居住している州など、典型的な顧客情報のデータセットを使用します。検索フィールドと[Add filter] (フィルターを追加)ボタンを使い、カリフォルニアの男性顧客のみを表示するフィルターをこれから作成します。

手順

  1. グリッド左上の[Add a filter] (フィルターを追加)フィールドに、フィルター処理する値、この例では、californiaと入力していきます。Talend Data Preparationによって、この値を含むカラムが候補に挙がります。

    候補は、サンプルに含まれるデータに基づいています。

  2. [california in state] (カリフォルニア州)を選択して、この場所に相当するエントリーだけが表示されます。

    フィルターバーを見ると、contains演算子によってフィルターが正しく適用されたことがわかります。

    フィルターバッジを編集することでどの値でも検索できます。

    [Add filter] (フィルターの追加)フィールドは、サンプル全体の値を迅速かつより正確に検索できるだけでなく、使用するカラム、演算子、キーワードを手動で選択するうえでも便利です。これから別のフィルターを適用し、既にフィルター処理された顧客から男性顧客を分離します。今回は[Add filter] (フィルターの追加)ボタンを使います。

  3. [Add filter] (フィルターを追加)ボタンをクリックして新しいバッジを作成します。
  4. カラムのリストで、genderを選択します。
  5. 演算子としてEqual toを選択します。
  6. キーワードとしてmaleと入力して[Apply] (適用)をクリックし、前のフィルターにこのフィルターを追加します。

    グリッドには、これらの2つのフィルターに合うデータだけが表示されます。

  7. ファンクションパネルで、フィルター処理されたデータに対して実行するファンクションをクリックします。この例では、[Keep these Filtered Rows] (フィルター処理された行を維持)です。
  8. フィルターバーで、各フィルターのX印をクリックするか、ごみ箱アイコンをクリックしてフィルターを消去し、再びデータセット全体を表示します。

タスクの結果

データのフィルタリング処理によって特定の顧客グループを分離したので、このサンプルだけにファンクションを適用し、作業を行うことができます。

フィルターを手動で適用することも、チャートパネルを使ってより複雑なフィルターを作成することもできます。