日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用する分析の結果から正規表現パターンを生成できます。
始める前に
Talend StudioのProfilingパースペクティブで、[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用して日付カラムでカラム分析が作成されていること。
注: 日付カラムに[Date Pattern Frequency] (日付パターン頻度テーブル)インジケーターを使用するには、カラム分析エディターの[Analysis Parameter] (分析パラメーター)ビューで実行エンジンをJavaに設定する必要があります。実行エンジンの詳細は、
JavaエンジンまたはSQLエンジンの使用をご覧ください。
カラム分析の作成方法の詳細は、データベースカラムでの基本分析の作成をご覧ください。
手順
-
[DQ Repository] (DQリポジトリー)ツリービューで、日付カラムで日付インジケーターを使用するカラム分析を右クリックします。
-
コンテキストメニューから[Open] (開く)を選択して対応する分析エディターを開きます。
-
F6を押して分析を実行し、分析結果をエディターの[Analysis Results] (分析結果)ビューに表示します。
この例では、yyyy MM dd
というパターンに従っている日付値が100.00%、yyyy dd MM
というパターンに従っている日付値が39.41%となっています。
-
正規表現を生成する日付値を右クリックして、コンテキストメニューから[Generate Regex Pattern] (Regexパターンを生成)を選択します。
[New Regex Pattern] (新規正規表現パターン)ダイアログボックスが表示されます。
-
[Next] (次へ)をクリックします。
日付の正規表現が対応するフィールドにあらかじめ定義されています。
-
[Finish] (終了)をクリックして、次の手順に進みます。
パターンエディターが開き、定義されたメタデータと生成されたパターン定義が表示されます。
新しい正規表現は、[DQ Repository] (DQリポジトリー)ツリービューのフォルダーの下にリストされます。この正規表現は分析エディターの任意の日付カラムにドラッグできます。
- オプション:
必要に応じて、パターンテストビューで正規表現をテストするで説明されているように[Test] (テスト)ボタンをクリックし、この日付正規表現で文字列をテストします。