サスペクトペアに割り当て済みのラベルを付ける - 7.3

機械学習を使ってマッチング

Version
7.3
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > マッチングおよび機械学習コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > マッチングおよび機械学習コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > マッチングおよび機械学習コンポーネント
Last publication date
2024-02-06

このシナリオは、Talend Data Fabricを備えたサブスクリプションベースの ビッグデータ関連Talend Platform製品のみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

Sparkとの一致で使用される2つのワークフローについては、Sparkのマッチングをご覧ください。

Sparkのマッチングで使用する2つのワークフローの詳細は、Talend Help Center(https://help.talend.com)のドキュメンテーションをご覧ください。

このユースケースでは以下のコンポーネントが使用されます:

  • tFileInputDelimitedコンポーネント。tMatchPairingによって生成される入力の疑わしいペアを読み取ります。

  • tMatchPredictコンポーネント。疑わしいレコードを自動的にラベル付けし、コンポーネントプロパティのラベルセットにマッチする疑わしいレコードをグルーピングします。

  • tFileOutputDelimitedコンポーネント。サスペクトレコードに作成された、ラベル付け済みの重複レコードとグループのうち、tMatchPredictプロパティ内のラベルセットとマッチングするものを出力します。