マッチングキーを定義 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

手順

  1. ルールエディターの[Matching Key] (マッチングキー)テーブルで、[+]ボタンをクリックしてテーブルに行を追加します。
  2. 次のようにマッチングキーのパラメーターを設定します。
    • Match Key Name (マッチキー名): マッチキーの任意の名前を入力します。

    • Matching Function (マッチングファンクション): ドロップダウンリストから、実行するマッチングのタイプを選択します。外部のユーザー定義マッチングアルゴリズムを使用する場合は、[Custom] (カスタム)を選択します。

      この例では2つのマッチングキーが定義されており、ファーストネームとラストネームにそれぞれ[Levenshtein][Jaro-Winkler]という一致メソッドを使用して重複レコードを取得します。

    • [Custom Matcher] (カスタムマッチャー): この項目は[Custom] (カスタム)マッチングファンクションとのみ使われます。ユーザー定義アルゴリズムのJarファイルを参照して選択します。

    • Confidence Weight (信頼度の重み): マッチキーとして使用する列に数値の重み(1から10)を設定します。この値を使用すると、マッチングを実行する時に特定の列の重要度が高くなります。

    • Handle Null (Nullの処理): Null値を含むデータレコードの処理方法を指定します。

    マッチングルールのパラメーターの詳細は、tMatchGroupのドキュメンテーションをご覧ください。
  3. [Match threshold] (しきい値の一致)フィールドに、一致可能性のしきい値を入力します。確率がこの値を超えると、2つのデータレコードは一致と見なされます。
    [Confident match threshold] (信頼できるマッチングしきい値)フィールドで、現在の[Match threshold] (マッチングしきい値)1の間に数値を設定します。このしきい値を超えていれば、グループのクオリティは信頼できます。
  4. 2番目のマッチングルールを定義するには、[Matching Key] (マッチングキー)テーブルの右上にカーソルを置き、[+]ボタンをクリックします。
    手順に従ってマッチングルールを作成します。
    マッチングルールエディターで複数の条件を定義すると、分析データでORマッチング操作が実行されます。レコードは最初のルールを基に評価され、そこで一致したレコードは2番目のルールでは評価されません。
  5. オプション: ルールのデフォルト名を変更したい場合は、テーブルの右上にカーソルを置き、ボタンをクリックします。
    また、ダイアログボックスで上向きおよび下向き矢印を使用してルールの順序を変更し、最初に実行するルールを決定できます。
  6. OKをクリックします。
    ルールに名前が付けられ、それに基づいて[Matching Key] (マッチングキー)テーブルに並べられます。
  7. マッチングルール設定を保存します。
    マッチングルールは、[DQ Repository] (DQリポジトリー)ツリービューの[Libraries] (ライブラリー) > [Rule] (ルール) > [Match] (一致)の下に保存され一元管理されます。