[Date Pattern Frequency] (日付パターン頻度テーブル)から正規表現を生成する - 7.3

Talend Big Data Platform Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用する分析の結果から正規表現パターンを生成できます。

始める前に

Talend StudioProfilingパースペクティブで、[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用して日付カラムでカラム分析が作成されていること。

注: 日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用するには、カラム分析エディターの[Analysis Parameter] (分析パラメーター)ビューで実行エンジンをJavaに設定する必要があります。実行エンジンの詳細は、JavaエンジンまたはSQLエンジンの使用を参照してください。

カラム分析の作成方法の詳細は、データベースカラムでの基本分析の作成を参照してください。

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで、日付カラムで日付インジケーターを使用するカラム分析を右クリックします。
  2. コンテキストメニューから[Open] (開く)を選択して対応する分析エディターを開きます。
  3. F6を押して分析を実行し、分析結果をエディターの[Analysis Results] (分析結果)ビューに表示します。
    この例では、yyyy MM ddというパターンに従っている日付値が100.00%、yyyy dd MMというパターンに従っている日付値が39.41%となっています。
  4. 正規表現を生成する日付値を右クリックして、コンテキストメニューから[Generate Regex Pattern] (Regexパターンを生成)を選択します。
    [New Regex Pattern] (新規正規表現パターン)ダイアログボックスが表示されます。
  5. [Next] (次へ)をクリックします。
    日付の正規表現が対応するフィールドにあらかじめ定義されています。
  6. [Finish] (終了)をクリックして、次の手順に進みます。

    パターンエディターが開き、定義されたメタデータと生成されたパターン定義が表示されます。

    新しい正規表現は、[DQ Repository] (DQリポジトリー)ツリービューの[Pattern] (パターン) > [Regex] (正規表現)フォルダーの下にリストされます。この正規表現は分析エディターの任意の日付カラムにドラッグできます。
  7. オプション: 必要に応じて、パターンテストビューで正規表現をテストするで説明されているように[Test] (テスト)ボタンをクリックし、この日付正規表現で文字列をテストします。