2つのカラムであいまいマッチングを行って、メインデータとリジェクトデータを出力 - Cloud - 8.0

Fuzzy matching

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
Last publication date
2023-09-07
Deprecated: 7.3の一般公開リリース以降、tFuzzyJoinコンポーネントは非推奨になっています。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

このシナリオは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

このシナリオでは、次の処理を実行する5コンポーネントジョブについて説明します。まずは、参照入力ファイルのデータに対して入力ファイルのIdClientカラムの間の編集距離をチェックして、次に参照入力ファイルのデータに対してEmailカラムで発音ごとにメールアドレスをすべてチェック。これらの2つのマッチングタイプの出力は、2つの別々のファイルに書き込まれます。

このシナリオでは、入力ファイルと参照ファイルの入力スキーマがリポジトリーに保存済みであることが前提になっています。[Repository] (リポジトリー)ツリービューにスキーマメタデータを保管する方法については、Studioでメタデータを管理をご覧ください。