年齢と州へのフィルターの作成 - 2.5

Talend Data Preparation の簡単な例

author
Talend Documentation Team
EnrichVersion
7.0
2.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データクオリティとプレパレーション > データクレンジング
EnrichPlatform
Talend Data Preparation

データを識別または隔離する簡単な方法は、フィルターを作成することです。

ここでもフィルターを使って、この例で最も重要なデータ、つまり、顧客の年齢と居住地を隔離します。インターフェイスの右下にあるデータプロファイリングエリアでは、age (年齢)state (州)のカラムのデータを示すチャートを操作して、特定のデータ範囲を選択できます。

手順

  1. age (年齢)カラムのヘッダーをクリックしてその内容を選択します。

    画面右下のデータプロファイリングエリアには、カラムに表示されている各値の出現数を示す縦棒グラフがあります。

    その中にある最小の年齢は18歳で、最大値は80歳です。

  2. グリッドに表示されている年齢の値を制限し、30~55歳の範囲のフィルターを作成するには、次の手順を実行します。
    • 範囲スライダーの両端をドラッグして、表示する最小値と最大値を選択します。
    • 最小値として30、最大値として55を、該当するフィールドに直接入力します。

    新しいフィルターがデータセットに適用され、顧客データは、30~55歳の範囲で設定された条件を満たすものだけが表示されます。

    フィルターは、フィルターバーのテキストエリアに値を手動で入力すれば作成できますが、一度に1つまたは複数のカラムのデータにフィルターを適用する便利で簡単な方法は、ダイアグラムを使用する方法です。

    特定の年齢範囲に関するビジョンを得たので、最初のフィルターの上に2つ目のフィルターを加えます。フィルターは多くの方法で組み合わせることができます。ここでは、顧客数が最も多い5つの州を表示することにします。

  3. state (州)カラムのヘッダーをクリックしてその内容を選択します。

    今回は、データをプロファイリングエリアの横棒グラフとして表示します。

  4. 顧客数が最も多い上位5州を作成するには、[Shift]キーを押したまま、CaliforniaTexasFloridaNew YorkVirginiaをクリックします。

    フィルターバーを見ると、フィルターは最初にフィルターの上に適用され、両方を満たすデータだけがグリッドに表示されています。

  5. 使用されなくなったデータを削除し、このサンプルだけを維持するには、ファンクションパネルで[Keep these filtered rows] (フィルター処理された行を維持)ファンクションをクリックします。

    このファンクションは、[Apply changes to: Filtered rows] (変更の適用先: フィルター処理済みの行)ラジオボタンが有効になっている場合にだけ使用できます。

  6. ゴミ箱アイコンをクリックするか各フィルターのバツ印をクリックして、フィルターバーを消去します。

タスクの結果

サンプルでは、設定した条件を満たす限られた顧客だけのリストが表示されます。