[Date Pattern Frequency] (日付パターン頻度テーブル)から正規表現を生成する - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用する分析の結果から正規表現パターンを生成することができます。

前提条件: StudioのProfilingパースペクティブで、[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用して日付カラムでカラム分析が作成されていること。

警告: 日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用するには、カラム分析エディターの[Analysis Parameter] (分析パラメーター)ビューで実行エンジンをJavaに設定する必要があります。実行エンジンの詳細は、JavaエンジンまたはSQLエンジンの使用を参照して下さい。

カラム分析の作成方法の詳細は、データベースカラムでの基本分析の作成を参照して下さい。

カラム分析の結果から正規表現を生成するには、次の手順に従います。

手順

  1. [DQ Repository] (DQリポジトリ)ツリービューで、日付カラムで日付インジケーターを使用するカラム分析を右クリックします。
  2. コンテキストメニューから[Open] (開く)を選択して対応する分析エディターを開きます。
  3. F6を押して分析を実行し、分析結果をエディターの[Analysis Results] (ビュー)に表示します。
    この例では、日付値の100.00%がパターン yyyy MM ddに従い、39.41%がパターン yyyy dd MMに従っています。
  4. 正規表現を生成する日付値を右クリックして、コンテキストメニューから[Generate Regex Pattern] (Regexパターンを生成)を選択します。
    [New Regex Pattern] (新規正規表現パターン)ダイアログボックスが表示されます。
  5. [Next] (次へ)をクリックします。
    日付の正規表現が対応するフィールドに予め定義されています。
  6. [Finish] (終了)をクリックして、次の手順に進みます。
    パターンエディターが開き、定義されたメタデータと生成されたパターン定義が表示されます。
    新しい正規表現は、[DQ Repository] (DQリポジトリ)ツリービューの[Pattern] (パターン) > [Regex]フォルダーの下にリストされます。この正規表現は分析エディターの任意の日付カラムにドラッグすることができます。
  7. 必要に応じて、パターンテストビューで正規表現をテストするで説明されているように[Test] (テスト)ボタンをクリックし、この日付正規表現で文字列をテストします。