2つのカラムにファジーマッチを実行してメインデータとリジェクトデータを出力(非推奨) - 7.3

Fuzzy matching

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント

このシナリオは、Talend Data Management PlatformTalend Big Data PlatformTalend Real Time Big Data PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオでは、次の処理を実行する5コンポーネントジョブについて説明します。first checking the edit distance between the IdClient column of an input file against the data of the reference input file, and second checking all emails by their pronunciation in the Email column against the data of the reference input file. これらの2つの一致するタイプの出力は、2つの別々のファイルに書き込まれます。

このシナリオでは、入力ファイルと参照ファイルの入力スキーマがリポジトリーに保存済みであることが前提になっています。[Repository] (リポジトリー)ツリービューにスキーマメタデータを保管する方法の詳細は、 Talend Studioユーザーガイドを参照してください。