クエリーテンプレートは、正規表現に対してカラムを分析するために必要なクエリー論理を定義します。
Talend Studioでクエリーテンプレートを定義する手順には次が含まれます。
- 特定のデータベースに対するクエリーテンプレートを作成する
- この表現がすべてのデータベースで使用できるほどシンプルではない場合は、データベース専用の正規表現を設定する
下の例で、Microsoft SQL Serverデータベース固有のクエリーテンプレートを定義する方法を示します。
始める前に
Talend Studioで Profiling パースペクティブを選択していること。
手順
-
[DQ Repository] (DQリポジトリー)ツリービューで、の順に展開します。
-
の順に展開します。
-
[Regular Expression Matching] (正規表現マッチング)をダブルクリックするか、右クリックしてコンテキストメニューから[Open] (開く)を選択します。
対応するビューが開きインジケーターメタデータとその定義が表示されます。
ここで、クエリーテンプレートを定義するデータベースをデータベースのリストに追加する必要があります。このクエリーテンプレートは正規表現マッチングを計算します。
-
[Indicator Definition] (インジケータ定義)ビューの下にある[+]ボタンをクリックして新しいテンプレート用のフィールドを追加します。
-
新しいフィールドで、矢印をクリックしてテンプレートを定義するデータベースを選択します。この例では、[Ingres]を選択します。
-
他のデータベースのいずれかからインジケーター定義をコピーします。
-
新しいフィールドの横にある[Edit...] (編集...)ボタンをクリックします。
[Edit expression] (式の編集)ダイアログボックスが表示されます。
-
インジケーター定義(テンプレート)を[Expression] (式)ボックスに貼り付けた後、選択したデータベースにテンプレートを適合できるよう、
WHEN
の後のテキストを変更します。この例では、WHEN
の後のテキストをWHEN REGEX
に置き換えます。
-
[OK]をクリックします。新しいテンプレートがフィールドに表示されます。
-
エディターの上部にある保存アイコンをクリックして変更を保存します。
タスクの結果
Ingresデータベース専用のクエリーデータベースの作成が完了しました。このデータベースのカラムを正規表現で分析できるようになりました。
このサーバーのデータ分析に使用する正規表現が、すべてのデータベースで使用できるほどシンプルなものであれば、カラムの分析をすぐに始めることができます。そうでない場合は、特定のデータベース(この例ではIngres)で機能するように正規表現の定義を編集する必要があります。
ユーザー定義インジケーターを使用した分析が一度でも正しく実行されれば、後でデータベースのインジケーター定義テンプレートが削除されても、分析は失敗しません。以前に生成されたSQLクエリーを使用するので、実行され続けます。
データベース特有の正規表現定義の設定方法について詳しくは、正規表現またはSQLパターンの編集をご覧ください。