メイン コンテンツをスキップする

T-Swooshアルゴリズム

このシナリオはTalend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend MDM PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

このシナリオでは、Jaro-Winklerマッチングメソッドをlnameカラムとfnameカラムに使って、入力ファイル内のカラムを比較する基本的なジョブについて説明します。次に、出力レコードを次の出力フローにグルーピングします。
  • [Uniques] (一意値): グループサイズ(レコードで計算された最小距離)が1に等しいレコードをリスト表示します。

  • [Matches] (マッチング): グループの品質が[Confident match threshold] (信頼できるマッチングしきい値)フィールドで定義したしきい値と同等かそれ以上のレコードをリスト表示します。

  • [Suspects] (サスペクト): グループの品質が[Confident match threshold] (信頼できるマッチングしきい値)フィールドで定義したしきい値を下回るレコードをリスト表示します。

グループの品質は、グループのすべてのレコードペア間で計算された最小距離です。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。