一致モデルの生成 - 7.3

機械学習を使ってマッチング

Version
7.3
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > マッチングおよび機械学習コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > マッチングおよび機械学習コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > マッチングおよび機械学習コンポーネント
Last publication date
2024-02-06

このシナリオは、Talend Data Fabricを備えたサブスクリプションベースの ビッグデータ関連Talend Platform製品のみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

tMatchModelコンポーネントでは、tMatchPairingコンポーネントによって生成された疑わしいサンプルペアを読み取ってから、手動でラベル付けします。

詳細は、tMatchPairingドキュメンテーションのTalend Help Center (https://help.talend.com)をご覧ください。

tMatchModelコンポーネントでは、いくつかのマッチングモデルが生成され、学習パラメーターの最適な組み合わせが自動的に検索され、クロス検証の結果として出される最適なマッチングモデルが保持されます。

ここで説明するユースケースでは、以下のコンポーネントが使用されます:

  • tFileInputDelimitedコンポーネント。tMatchPairingによって生成された疑わしいデータペアを含むソースファイルが読み取られます。

  • tMatchModelコンポーネント。疑わしいレコードからフィーチャーを生成し、Random Forestアルゴリズムの実装により分類モデルを作成します。