パターンインジケーターの編集とカラム分析での使用 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

データベース内の分析済みカラムで正規表現を使用できるようになる前に、SQLインストラクションとパターンを追加して作成した正規表現ファンクションを宣言する必要があります。

始める前に

  • Teradataで正規表現を作成済みであること。
  • Profilingパースペクティブを選択済みであること。

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで、[Libraries] (ライブラリー) > [Indicators] (インジケーター) > [System Indicators] (システムインジケーター) > [Pattern Matching] (パターンマッチング)と展開します。
  2. [Regular Expression Matching] (正規表現マッチング)をダブルクリックするか、右クリックしてコンテキストメニューから[Open] (開く)を選択します。
    対応するビューが開き、インジケーターメタデータとその定義が表示されます。
  3. Teradata行までスクロールダウンします。
  4. [Edit...] (編集...)をクリックします。
    [Edit expression] (式を編集)ダイアログボックスが開きます。
  5. [Expression] (式)ボックスに次のSQL式を追加します:
    SELECT COUNT(CASE WHEN Regex_INSTR(<%=__COLUMN_NAMES__%>,<%=__PATTERN_EXPR__%>) =1 THEN 1 END), COUNT(*)FROM <%=__TABLE_NAME__%> <%=__WHERE_CLAUSE__%>
  6. パターンインジケーターをカラム分析に追加します。
    1. [Analysis Setting] (分析設定)ページで[Data preview] (データプレビュー)パートを展開します。
    2. [Select Indicators] (インジケーターを選択)をクリックします。
    3. [Patterns] (パターン)を展開し、必要なパターンを選択します。
      選択中のパターンに関係なく、この新しい式が使用されるようになります。
  7. 分析を実行し、[Analysis Results] (分析結果)ページに切り替えます。
  8. [Pattern Matching] (パターン一致)テーブルでパターン結果を右クリックし、たとえば[View invalid rows] (無効な行を表示)を選択します。SQLエディターが開き、無効なデータがリスト表示され、SQL式は次のようになります:
    SELECT * FROM "test"."Employee" WHERE ( not REGEX_INSTR("FULLNAME" , '^[A-Z]+' ) =1 OR "FULLNAME" IS NULL )