マッチングルールをStudio Talendリポジトリーからインポート
tMatchGroup設定ウィザードを使って、 Profiling パースペクティブで作成およびテストされたマッチングルールからマッチングキーをインポートできます。このインポートされたマッチングキーをマッチジョブで使用できます。
tMatchGroupコンポーネントを使用すると、VSRまたはT-Swooshアルゴリズムに基づいてStudio Talendのリポジトリーマッチングルールからインポートできます。
VSRアルゴリズムはレコードのセットを入力と見なし、定義されたマッチルールに基づいて、検出された類似の重複値をグルーピングします。このアルゴリズムは、レコードのペアを比較してグループに割り当てます。各グループで最初に処理されたレコードがそのグループのマスターレコードとなります。VSRアルゴリズムは各レコードを各グループのマスターレコードと比較し、計算されたマスターレコードからの距離を使ってそのグループの割り当て先を決定します。
T-Swooshアルゴリズムを使用して重複を検出するか、2つの類似のレコードをマージし、サバイバーシップファンクションを使用してマスターレコードを作成する方法を定義できます。このような新しくマージされたレコードは、新たな重複を検出するために使用されます。VSRアルゴリズムとの相違は、通常マスターレコードが入力レコードのリストに存在しない新規レコードとなる点です。
手順
このページは役に立ちましたか?
このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。