新しい正規表現またはSQLパターンを作成 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-03-20
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

新しい正規表現またはSQLパターン(Java用を含む)を作成してカラム分析で使用できます。

正規表現とSQLパターンの管理プロセスは同じです。以下で紹介するステップとスクリーンショットは正規表現の作成ステップを説明したものです。同じステップに従ってSQLパターンを作成できます。

始める前に

Profilingパースペクティブを選択済みであること。

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで、[Libraries] (ライブラリー) > [Patterns] (パターン)と展開し、[Regex] (正規表現)を右クリックします。
  2. コンテキストメニューから[New Regex Pattern] (新規正規表現パターン)を選択して対応するウィザードを開きます
    ウィザードを開くとヘルプパネルが自動的に表示されます。このヘルプパネルには新しい正規表現パターンを作成するためのステップが表示されます。
  3. [Name] (名前)フィールドに、新しい正規表現の名前を入力します。
    重要:

    ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " " " < > といった特殊文字は項目名に使用しないでください。

    ファイルシステムでは、これらの文字はすべて"_"に置き換えられ、重複する項目が作成されてしまう場合があります。

  4. オプション: 該当するフィールドで、その他のメタデータ(目的説明作成者)を設定して[Next] (次へ)をクリックします。
  5. [Regular expression] (正規表現)フィールドに作成する正規表現の定義を入力します。正規表現は一重引用符で囲む必要があります。
    注:

    PostgreSQLデータベースの場合、正規表現はデータベースの異なるバージョン間で互換性がありません。

    PostgreSQLバージョン9.1以降で正規表現を使用する場合は、次のいずれかを実行する必要があります。
    • PostgreSQLデータベース設定で、standard_conforming_stringsパラメーターをoffに設定し、定義内に二重のバックスラッシュを記述するか、
    • ウィザードの[Regular expression] (正規表現)フィールドの表現定義で単一のバックスラッシュを使用します。

    PostgreSQL正規表現の詳細を確認するには、[Window] (ウィンドウ) > [Show View] (ビューを表示)を選択して[Help] (ヘルプ)を展開し、[Bookmarks] (ブックマーク)を選択します。

  6. [Language Selection] (言語選択)リストから言語を選択します(特定のデータベースまたはJava)。
    注:

    [Language Selection] (言語選択)リストからデータベースを選択すると、カラム分析の結果に対してELTジョブを生成し、有効なカラムと無効なカラムを再取得できます。[Java]または[Default] (デフォルト)の言語を選択すると、カラム分析の結果に対してETLジョブを生成できます。

    有効行、無効行、その両方を再取得するジョブの生成に関する詳細は、カラム分析で有効および無効な行を取得をご覧ください。

  7. [Finish] (終了)をクリックしてダイアログボックスを閉じます。
    [DQ Repository] (DQリポジトリー)ツリービュー内のRegexフォルダーの下に新しい正規表現のサブフォルダーが表示され、定義されたメタデータと正規表現が表示されたパターンエディターが開きます。
  8. [Pattern Definition] (パターン定義)ビューで、[+]ボタンをクリックし、新しいパターンに必要なだけ正規表現を追加します。
    任意の利用可能なデータベースまたはJava専用の正規表現を定義できます。
    注: 正規表現がどのデータベースででも利用できるほどシンプルである場合は、リストで[Default] (デフォルト)を選択します。
    [DQ Repository] (DQリポジトリー)ツリービューの[Patterns] (パターン)フォルダーの中にある新しいパターン名の下に、指定されたデータベースタイプまたはJavaのラベルが付いたサブフォルダーが表示されます。
  9. 新しいパターンを保存します。
    パターン作成後、開いている分析エディターのデータベースカラムにパターンを直接ドロップできます。
  10. オプション: パターン名をクリックし、Talend Studio[Detail View] (詳細ビュー) [Technical] (テクニカル)ビューで詳細を表示します。