パターンを基にデータをフィルタリングする - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

パターン群を基にカラムのセットを分析し、"すべて"のパターンに一致または一致しない行の結果が得られたら、使用されたパターンに応じて有効なデータまたは無効なデータをフィルタリングできます。

前提条件: StudioのProfilingパースペクティブの分析エディターで、カラムセット分析が開かれていること。Javaエンジンを使用して分析を実行していること。

詳細は、分析するカラムのセットを定義するおよび分析対象カラムにパターンを追加するを参照して下さい。

カラムセット分析の結果データをフィルタリングするには、次の手順に従います。

手順

  1. 分析エディターで、エディターの下部にある[Analysis Results] (分析結果)タブをクリックし、詳細な結果ビューを開きます。
  2. [Data] (データ)をクリックし、該当するビューを開きます。
    このテーブルには、分析カラムで実際に分析されたデータが一覧表示されます。
  3. テーブルの上部にある[Filter Data] (データのフィルタリング)をクリックします。
    ダイアログボックスが開き、カラムセット分析で使用されたパターンがすべてリスト表示されます。
  4. データをフィルター処理するパターンのチェックボックスをオンにします。
  5. 次のように表示オプションを選択します。

    選択内容

    動作

    [All data] (すべてのデータ)

    すべての分析されたデータを表示します。

    [matches] (一致)

    選択されたパターンに一致するデータのみを表示します。

    [non-matches] (不一致)

    選択されたパターンに一致しないデータを表示します。

  6. [Finish] (終了)をクリックして、ダイアログボックスを閉じます。
    この例では[Email Address] (電子メールアドレス)パターンを基にフィルタリングされており、一致しないデータのみ表示されています。
    選択されたパターンに一致しない電子メールアドレスはすべて赤で表示されます。値が存在しないデータ行は背景が赤く表示されます。
    ページを先へ進めたり戻ったりするには、テーブルの下にある[Next] (次へ)と[Previous] (前へ)のボタンを使用します。
    テーブルの下にある番号のボタンをクリックすると、各ページに直接アクセスできます。
    • 分析実行後初めて[Data] (データ)ビューを開いたとき、

    • [Filter Data] (データのフィルタリング)ダイアログボックスでパターンを選択しなかった場合、または

    • [Filter Data] (データのフィルタリング)ダイアログボックスで、表示オプションとして[All data] (すべてのデータ)を選択した場合。