Teradataで正規表現を使用する
正しくないデータを識別するには、パターンインジケーターを使用する方法があります。これらのインジケーターの作業には正規表現が使用されます。Teradataでは、正規表現関数はバージョン14からのみデフォルトでインストールされます。
バージョン14よりも古いバージョンのTeradataで正規表現関数を使用するには、ユーザー定義関数(UDF)をインストールする必要があります。
Teradataでのユーザー作成
CREATE FUNCTIONとEXECUTE FUNCTIONというアクセス権を持つTeradataユーザーを作成する必要があります。
手順
Cプログラムを使ったUDF (ユーザー定義関数)の作成
Cプログラムを使ってUDF (User Defined Function)関数を作成し、Teradataデータベースにインストールすれば、正規表現を使用できるようになります。
始める前に
- このページの左パネルにある[Downloads] (ダウンロード)タブからRegex_INSTR.cファイルを取得します。
手順
パターンインジケーターの編集とカラム分析での使用
データベース内の分析済みカラムで正規表現を使用できるようになる前に、SQLインストラクションとパターンを追加して作成した正規表現関数を宣言する必要があります。
手順
[Pattern Test] (パターンテスト)ビューの使用
[Pattern Test View] (パターン テストビュー)では、正規表現に対してテキストの文字列をテストできます。
手順
- Talend Studioのメニューバーで 、 をクリックします。
- フィルターフィールドにPattern Test Viewと入力します。
- [Pattern Test View] (パターンテストビュー)を選択し、[OK]をクリックします。
- [DB Connections] (DB接続)オプションを選択し、リストでTeradata接続を選択します。
- [Test Area] (テストエリア)と[Regex]フィールドに、テスト文字列と正規表現をそれぞれ入力します。
- [Test] (テスト)ボタンをクリックします。
タスクの結果
一致または非一致のテキストがビューに表示されます。