メイン コンテンツをスキップする

同じ機能キーを持つ出力フロー重複レコード内でカラムを比較し、グルーピングする

このシナリオはTalend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend MDM PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

この2番目のシナリオでは、次を目的とするジョブについて説明します。

  • シナリオ1で説明したように、入力カラムの1つのDoB上でアルゴリズムを1つ使用して機能キーを生成します。

  • Jaro-Winklerアルゴリズムを使用して2つの入力カラムを照合します。

  • 生成された機能キーによって出力カラムをグルーピングして、一致操作を最適化し、このシナリオの同じブロッキング値や機能キーを持つレコードのみを比較します。出力カラムのグルーピングとブロッキング値の使用については、tMatchGroupをご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。