パターンインジケーターの編集とカラム分析での使用 - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発
データベース内の分析済みカラムで正規表現を使用できるようになる前に、SQLインストラクションとパターンを追加して作成した正規表現関数を宣言する必要があります。

手順

  1. Profilingパースペクティブで、[Libraries] (ライブラリー) > [Indicators] (インジケーター) > [System Indicators] (システムインジケーター)を展開します。
  2. [Pattern Matching] (パターンマッチング )フォルダーで、[Regular Expression Matching] (正規表現マッチング)をダブルクリックします。
  3. [Indicator Definition] (インジケーター定義)ビューで、[+]をクリックします。
  4. 新しいインジケーター行の[Database] (データベース)リストでからTeradataを選択します。
  5. 新しいフィールドの横にある[Edit...] (編集...)をクリックし、[Edit expression] (式の編集)ダイアログボックスを表示させます。
  6. [Expression] (式)ボックスに次のSQL式を追加します:
    SELECT COUNT(CASE WHEN Regex_INSTR(<%=__COLUMN_NAMES__%>,<%=__PATTERN_EXPR__%>) =1 THEN 1 END), COUNT(*)FROM <%=__TABLE_NAME__%> <%=__WHERE_CLAUSE__%>
  7. 変更したパターンインジケーターをカラム分析に追加します。
  8. 分析を実行し、[Analysis Results] (分析結果)ページに切り替えます。
  9. [Pattern Matching] (パターン一致)テーブルでパターン結果を右クリックし、たとえば[View invalid rows] (無効な行を表示)を選択します。SQLエディターが開き、無効なデータがリスト表示され、SQL式は次のようになります:
    SELECT * FROM "test"."Employee" WHERE ( not REGEX_INSTR("FULLNAME" , '^[A-Z]+' ) =1 OR "FULLNAME" IS NULL )