[Date Pattern Frequency] (日付パターン頻度テーブル)から正規表現を生成する - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio
日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用する分析の結果から正規表現パターンを生成することができます。

始める前に

Talend StudioProfilingパースペクティブで、[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用して日付カラムでカラム分析が作成されていること。

注: 日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用するには、カラム分析エディターの[Analysis Parameter] (分析パラメーター)ビューで実行エンジンをJavaに設定する必要があります。実行エンジンの詳細は、JavaエンジンまたはSQLエンジンの使用を参照して下さい。

カラム分析の作成方法の詳細は、データベースカラムでの基本分析の作成を参照して下さい。

手順

  1. [DQ Repository] (DQリポジトリー)ツリービューで、日付カラムで日付インジケーターを使用するカラム分析を右クリックします。
  2. コンテキストメニューから[Open] (開く)を選択して対応する分析エディターを開きます。
  3. [F6]を押して分析を実行し、分析結果をエディターの[Analysis Results] (分析結果)ビューに表示します。
    このサンプルでは、日付値の100.00%がパターン yyyy MM ddに従い、39.41%がパターン yyyy dd MMに従っています。
  4. 正規表現を生成する日付値を右クリックして、コンテキストメニューから[Generate Regex Pattern] (Regexパターンを生成)を選択します。
    [New Regex Pattern] (新規正規表現パターン)ダイアログボックスが表示されます。
  5. [Next] (次へ)をクリックします。
    日付の正規表現が対応するフィールドに予め定義されています。
  6. [Finish] (終了)をクリックして、次の手順に進みます。

    パターンエディターが開き、定義されたメタデータと生成されたパターン定義が表示されます。

    新しい正規表現は、[DQ Repository] (DQリポジトリー)ツリービューの[Pattern] (パターン) > [Regex] (正規表現)フォルダーの下にリストされます。この正規表現は分析エディターの任意の日付カラムにドラッグすることができます。
  7. オプション: 必要に応じて、パターンテストビューで正規表現をテストするで説明されているように[Test] (テスト)ボタンをクリックし、この日付正規表現で文字列をテストします。