編集ルールとサンプル結果の表示 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

手順

  1. 2番目のマッチングルールを定義するには、[Matching Key] (マッチングキー)テーブルの右上にカーソルを置き、[+]ボタンをクリックして新規ルールを作成します。
    マッチングルールを定義で説明されている手順に従い、マッチングキーを定義します。
    マッチングルールエディターで複数の条件を定義すると、分析データでORマッチング操作が実行されます。レコードは最初のルールを基に評価され、そこで一致したレコードは2番目のルールでは評価されない、というように続きます。
  2. ボタン([Matching Key] (マッチングキー)または[Match and Survivor] (一致およびサバイバー)セクションの右上)をクリックし、デフォルトのルール名をユーザー定義の名前に置換します。
    一致分析で複数のルールを定義する場合は、ダイアログボックスで上向きおよび下向き矢印を使用してルールの順序を変更し、最初に実行するルールを決定できます。
  3. OKをクリックします。
    ルールに名前が付けられ、それに基づいてセクション内に並べられます。
  4. [Match threshold] (しきい値の一致)フィールドに、一致可能性のしきい値を入力します。
    確率がこの値を超えると、2つのデータレコードは一致と見なされます。
    [Confident match threshold] (信頼できるマッチングしきい値)フィールドで、現在の[Match threshold] (マッチングしきい値)1の間に数値を設定します。
    一致分析によって計算されたGRP-QUALITY[Confident match threshold] (信頼できるマッチングしきい値)以上の場合は、グループのクオリティについて信頼できます。
  5. [Chart] (チャート)をクリックし、エディターで定義したブロッキングキーとマッチングルールに基づいてグループを計算して、サンプルデータの結果をチャートに表示します。
    分析されたデータの重複値の全体図がこのチャートに表示されます。[Hide groups less than] (次の値未満のグループを非表示)パラメーターは、デフォルトでは、2に設定されています。このパラメーターを使用して、チャートに表示するグループを決定できます。通常は、小さいグループサイズのグループを非表示にします。
    上の図では、1000サンプルを検証し、[Hide groups less than] (次の値未満のグループを非表示)パラメーターを2に設定して一意項目を除外した結果、
    • 49あるグループそれぞれに項目が2つずつ存在することを表しています。各グループで、2項目がお互いに重複しています。

    • 7グループで3項目が重複しており、最後のグループで4項目が重複しています。

    また、[Data] (データ)テーブルには各グループの項目一致に関する詳細が示され、一致チャートの色に基づいてグループが色分けされます。