メイン コンテンツをスキップする

Soundex頻度統計

このグループのインジケーターはDBMSに搭載されたSoundexアルゴリズムを使用します。

これらのインジケーターはレコードに音でインデックスを作成します。これにより、同じ英語の発音のレコードは同一の表記にエンコードされるため、スペルが多少異なっていてもマッチングさせることができます。

  • Soundex頻度: 同じ発音を持つレコードの合計と比べて頻度の高い個別のレコードの数を計算します。
  • Soundex低頻度: 同じ発音を持つレコードの合計と比べて頻度の低い個別のレコードの数を計算します。

Soundex頻度統計インジケーターをPostgreSQL、Amazon for PostgreSQL、Amazon Redshiftで使用するには、CREATE EXTENSION fuzzystrmatch;クエリーを使用して拡張子をPostgreSQLデータベースにインストールします。

詳細は、PostgreSQLのドキュメンテーションをご覧ください。

Soundex頻度統計インジケーターをAmazon Redshiftで使用するには、カスタムユーザー定義ファンクションを作成する方法もあります。

詳細は、Creating user-defined functionsをご覧ください。

Soundex頻度統計インジケーターをSnowflakeで使用するには、Javaエンジンが必要です。

漢字がサポートされているのはSQLエンジンのみです。

Teradata Soundexの実装にある制限により、このインジケーターを使用してTeradataのプロファイリング結果をドリルダウンできない場合があります。

どのデータベースでも選択できるインジケーターを次のテーブルに示します。

インジケーター Java解析エンジンでサポートされているデータ型 SQL解析エンジンでサポートされているデータ型
Soundex頻度テーブル Text Text
Soundex低頻度テーブル Text Text

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。