パターンを基にデータをフィルタリングする - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio
パターン群を基にカラムのセットを分析し、"全て"のパターンに一致または一致しない行の結果が得られたら、使用されたパターンに応じて有効なデータまたは無効なデータをフィルタリングできます。

始める前に

Talend StudioProfilingパースペクティブの分析エディターで、カラムセット分析が開かれていること。

Javaエンジンを使用して分析を実行していること。

詳細は、分析するカラムのセットを定義するおよび分析対象カラムにパターンを追加するを参照して下さい。

手順

  1. 分析エディターで、エディターの下部にある[Analysis Results] (分析結果)タブをクリックし、詳細な結果ビューを開きます。
  2. [Data] (データ)をクリックし、該当するビューを開きます。
    このテーブルには、分析カラムで実際に分析されたデータが一覧表示されます。
  3. テーブルの上部にある[Filter Data] (データのフィルタリング)をクリックします。
    ダイアログボックスが開き、カラムセット分析で使用されたパターンが全てリスト表示されます。
  4. データをフィルター処理するパターンのチェックボックスを選択します。
  5. 次のように表示オプションを選択します。
    選択 目的
    [All data] (全てのデータ) 全ての分析されたデータを表示します。
    [matches] (一致) 選択されたパターンに一致するデータのみを表示します。
    [non-matches] (不一致) 選択されたパターンに一致しないデータを表示します。
  6. [Finish] (終了)をクリックして、ダイアログボックスを閉じます。

タスクの結果

この例では[Email Address] (電子メールアドレス)パターンを基にフィルタリングされており、一致しないデータのみ表示されています。

選択されたパターンに一致しない電子メールアドレスは全て赤で表示されます。値が存在しないデータ行は背景が赤く表示されます。

ページを先へ進めたり戻ったりするには、テーブルの下にある[Next] (次へ)と[Previous] (前へ)のボタンを使用します。

テーブルの下にある番号のボタンをクリックすると、各ページに直接アクセスできます。

  • 分析実行後初めて[Data] (データ)ビューを開いたとき、
  • [Filter Data] (データのフィルタリング)ダイアログボックスでパターンを選択しなかった場合、または
  • [Filter Data] (データのフィルタリング)ダイアログボックスで、表示オプションとして[All data] (全てのデータ)を選択した場合。