カラム分析に正規表現またはSQLパターンを追加する - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

このタスクについて

カラム分析に1つ以上の正規表現とSQLパターンを追加して、分析するカラムの内容を一致させるために使用できます。

警告: 使用しているデータベースが正規表現をサポートしていない場合、またはクエリテンプレートがStudioで定義されていない場合は、パターンを指定してカラム分析に追加する前に、ユーザー定義関数とクエリテンプレートを定義する必要があります。詳細は、『データベース内でのユーザー定義関数の管理』を参照して下さい。

前提条件: StudioでProfilingパースペクティブを選択していること。分析エディターでカラム分析が開いていること。

カラム分析に正規表現またはSQLパターンを追加するには、以下のようにします:

手順

  1. 分析するカラムを定義するでの説明に従って、カラム分析を作成します。
  2. 分析エディターの[Analyzed Columns] (分析対象カラム)ビューで、正規表現またはSQLパターンを追加するカラム名(この例では[email] (電子メール)カラム)のとなりのアイコンをクリックします。
    [Pattern Selector] (パターン選択)ダイアログボックスが開きます。
  3. [Patterns] (パターン)を展開し、カラム分析に追加する正規表現またはSQLパターンを参照して探します。
  4. 選択したカラムに追加する正規表現またはパターンのチェックボックスを選択します。
  5. [OK]をクリックして、次の手順に進みます。
    追加した正規表現またはSQLパターンは、[Analyzed Columns] (分析対象カラム)リストの分析カラムの下に表示されます。
    カラム分析に正規表現またはSQLパターンを追加するには、[DQ Repository] (DQリポジトリー)ツリービューでドラッグして、分析されるカラムにドロップできます。
  6. 分析を保存し、[F6]を押して実行します。
    エディターが[Analysis results] (分析結果)ビューに切り替わります。カラム分析の結果には、パターンマッチングの結果も含まれます。

タスクの結果

カラム分析に追加する正規表現がデータベースに対して定義されていると、ELTジョブを生成して、有効な行または無効な行を再取得できます。

カラム分析に追加する正規表現がJavaまたはデフォルト言語に対して定義されていると、ETLジョブを生成して、行を処理できます。

ジョブを生成して有効な行、無効な行、両方の行を再取得する方法についての詳細は、カラム分析での有効および無効な行の取得を参照して下さい。正規表現の定義の詳細は、新しい正規表現またはSQLパターンを作成するを参照して下さい。