[Key definition] (キー定義)テーブルで[+]ボタンをクリックしてテーブルに行を追加します。[Input Key Attribute] (入力キー属性)カラムをクリックし、マッチングオペレーションを行うカラム(このシナリオではfirst_name)を選択します。
[Matching Function] (マッチングファンクション)カラムをクリックし、リストからSoundexを選択します。このメソッドでは、処理済みのエントリーが標準英語の音声アルゴリズムに従ってマッチングされます。このアルゴリズムでは、英語の発音による音で文字列にインデックスが作成されます。
[Tokenized measure] (トークン化された測定)リストで、選択したアルゴリズムにトークン化された距離を使用しないように指定します。
[Threshold] (しきい値)を0.8に、[Confidence Weight] (重み付け)を1に設定します。
マッチング結果にnull値の影響が最小となるように、[Handle Null] (NULLの扱い)カラムで[Null Match None] (Nullはマッチしない)を選択します。
[Survivorship Function] (サバイバーシップ機能)カラムで[Most common] (最も一般的)を選択します。このメソッドでは、重複の各グループで最も頻度の高い名前の値が検証されます。
[Default Survivorship Rules] (デフォルトサバイバーシップルール)テーブルで[+]ボタンをクリックしてテーブルに行を追加します。[Data Type] (データ型)カラムをクリックし、[Number] (番号)を選択します。
[Survivorship Function] (サバイバーシップ機能)カラムをクリックし、リストから[Largest (for numbers)] (最大(数字))を選択します。このメソッドでは、各グループで最大の数値が検証されます。
このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。