対象製品...Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
日付カラムに[Date Pattern Frequency] (日付パターン頻度)インジケーターを使用する分析の結果から正規表現パターンを生成できます。
始める前に
Talend Studioの
Profilingパースペクティブで、
[Date Pattern Frequency] (日付パターン頻度)インジケーターを使用して日付カラムでカラム分析が作成されていること。
注: 日付カラムに[Date Pattern Frequency] (日付パターン頻度)インジケーターを使用するには、カラム分析エディターの[Analysis Parameter] (分析パラメーター)ビューで実行エンジンをJavaに設定する必要があります。実行エンジンの詳細は、
JavaエンジンまたはSQLエンジンの使用をご覧ください。
カラム分析の作成方法の詳細は、データベースカラムで基本分析を作成をご覧ください。
手順
-
[DQ Repository] (DQリポジトリー)ツリービューで、日付カラムで日付インジケーターを使用するカラム分析を右クリックします。
-
コンテキストメニューから[Open] (開く)を選択して対応する分析エディターを開きます。
-
F6を押して分析を実行し、分析結果をエディターの[Analysis Results] (分析結果)セクションに表示させます。
この例では、yyyy MM dd
というパターンに従っている日付値が100.00%、yyyy dd MM
というパターンに従っている日付値が39.41%となっています。
-
正規表現を生成する日付値を右クリックして、コンテキストメニューから[Generate Regex Pattern] (Regexパターンを生成)を選択します。
[New Regex Pattern] (新規正規表現パターン)ダイアログボックスが表示されます。
-
[Next] (次へ)をクリックします。
日付の正規表現が対応するフィールドにあらかじめ定義されています。この例では、'(A9|20)[0-9{2}(-|/|)([0-0][1-9]|10|11|12)(-|/|)[0-3][0-9]$'
です。
-
[Finish] (終了)をクリックして、次のステップに進みます。
パターンエディターが開き、定義されたメタデータと生成されたパターン定義が表示されます。
新しい正規表現は、[DQ Repository] (DQリポジトリー)ツリービューのフォルダーの下にリストされます。この正規表現は分析エディターの任意の日付カラムにドラッグできます。
- オプション:
必要に応じて、パターンテストビューで正規表現をテストするで説明されているように[Test] (テスト)ボタンをクリックし、この日付正規表現で文字列をテストします。