手順
- [Record Linkage algorithm] (レコード連鎖アルゴリズム)セクションで、デフォルトで選択されていない場合は、[Simple VSR Matcher] (単純VSRマッチャー)を選択します。
-
[Data] (データ)セクションで[Select Matching Key] (マッチングキーの選択)タブをクリックし、一致アルゴリズムを適用するカラムの名前をクリックします。
選択された入力カラムと同じ名前を持つマッチングキーが、[Matching Key] (マッチングキー) テーブルにリスト表示されます。このテーブルからカラムを削除するには、そのカラムを右クリックして[Delete] (削除)を選択するか、[Data] (データ)テーブルでそのカラムの名前をクリックします。
-
使用する一致アルゴリズムを[Matching Function] (マッチング機能)カラムから、そしてNULL演算子を[Handle Null] (NULLの扱い)カラムから選択します。
この例では2つのマッチングキーが定義されており、ファーストネームとラストネームにそれぞれ[Levenshtein]と[Jaro-Winkler]という一致メソッドを使用して重複レコードを取得します。ユーザー定義の外部一致アルゴリズムを使用する場合は、[Custom] (カスタム)を選択し、[Custom Matcher] (カスタムマッチャー)カラムを使って、ユーザー定義アルゴリズムのJarファイルをロードします。マッチングルールのアルゴリズムとパラメーターの詳細は、TalendコンポーネントリファレンスガイドのtMatchGroupに関する記述をご覧ください。