ジョブを設定する - 7.3

Fuzzy matching

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > マッチング > ファジーマッチコンポーネント

手順

  1. [Repository] (リポジトリー)ツリービューで、入力スキーマを保存した[Metadata] (メタデータ)とファイルノードを展開し、該当するファイルをデザインワークスペースにドロップします。
    [Components] (コンポーネント)ダイアログボックスが表示されます。
  2. リストからtFileInputDelimitedを選択し、[OK]をクリックしてダイアログボックスを閉じます。
    tFileInputDelimitedコンポーネントがワークスペースに表示されます。このシナリオで使用している入力ファイルは、ClientSampleという名前です。ここには、ファジーマッチを実行したいIdClientEmailという2つのカラムを含む12個のカラムが含まれています。
  3. 参照として使用する2番目の入力ファイル(このシナリオではClientSample_Update)にも同じ手順を行います。
  4. コンポーネントtFuzzyJointFileOutputExcel、およびtFileOutputDelimited[Palette] (パレット)からデザインワークスペースにドロップします。
  5. [Main] (メイン)リンクを使用して、メインおよび参照入力ファイルをtFuzzyJoinに接続します。参照入力ファイルとtFuzzyJoinの間のリンクは、デザインワークスペース上では[Lookup] (ルックアップ)リンクとして表示されます。
  6. [Main] (メイン)リンクを使用してtFuzzyJointFileOutputExcelに接続し、[Inner join reject] (内部結合リジェクト)リンクを使用してtFuzzyJointFileOutputDelimitedに接続します。
  7. 必要に応じて、メインおよび参照入力ファイルをダブルクリックして、[Basic settings] (基本設定)ビューを開きます。プロパティフィールドすべてが自動的に入力されます。入力ファイルをリポジトリー内で定義しない場合は、[Property Type] (プロパティタイプ)フィールドで[Built-in] (組み込み)を選択した後で、詳細を手動で入力します。