2つのカラムにファジーマッチを実行してメインデータとリジェクトデータを出力(非推奨) - Cloud - 8.0

Fuzzy matching

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント

このシナリオは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオでは、次の処理を実行する5コンポーネントジョブについて説明します。まずは、参照入力ファイルのデータに対して入力ファイルのIdClientカラムの間の編集距離をチェックして、次に参照入力ファイルのデータに対してEmailカラムで発音ごとにメールアドレスをすべてチェック。これらの2つの一致するタイプの出力は、2つの別々のファイルに書き込まれます。

このシナリオでは、入力ファイルと参照ファイルの入力スキーマがリポジトリーに保存済みであることが前提になっています。[Repository] (リポジトリー)ツリービューにスキーマメタデータを保管する方法の詳細は、 Talend Studioユーザーガイドを参照してください。