VSRアルゴリズムを使ってマッチングキーを定義 - Cloud - 8.0

Talend Studioユーザーガイド

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-04-16
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

手順

  1. [Record Linkage algorithm] (レコード連鎖アルゴリズム)セクションで、デフォルトで選択されていない場合は[Simple VSR] (シンプルVSR)を選択します。
  2. [Data] (データ)セクションで[Select Matching Key] (マッチングキーを選択)タブをクリックし、一致アルゴリズムを適用するカラムの名前をクリックします。
    選択された入力カラムと同じ名前を持つマッチングキーが、[Matching Key] (マッチングキー) テーブルにリスト表示されます。
    [マッチングキー]セクションにあるマッチングキーとそのパラメーターの例。
    このテーブルからカラムを削除するには、そのカラムを右クリックして[Delete] (削除)を選択するか、[Data] (データ)テーブルでそのカラムの名前をクリックします。
  3. 使用する一致アルゴリズムを[Matching Function] (マッチングファンクション)カラムから、そしてNULL演算子を[Handle Null] (NULLの扱い)カラムから選択します。
    この例では2つのマッチングキーが定義されており、ファーストネームとラストネームにそれぞれ[Levenshtein][Jaro-Winkler]という一致メソッドを使用して重複レコードを取得します。
    ユーザー定義の外部一致アルゴリズムを使用する場合は、[Custom] (カスタム)を選択し、[Custom Matcher] (カスタムマッチャー)カラムを使って、ユーザー定義アルゴリズムのJarファイルをロードします。