編集ルールとサンプル結果の表示 - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発

手順

  1. 2番目のマッチングルールを定義するには、[Matching Key] (マッチングキー)テーブルの右上にカーソルを置き、[+]ボタンをクリックして新規ルールを作成します。
    マッチングルールの定義で説明されている手順に従い、マッチングキーを定義します。
    マッチングルールエディターで複数の条件を定義すると、分析データでORマッチング操作が実行されます。レコードは最初のルールを基に評価され、そこで一致したレコードは2番目のルールでは評価されない、というように続きます。
  2. ボタン([Matching Key] (マッチングキー)または[Match and Survivor] (一致およびサバイバー)セクションの右上)をクリックし、デフォルトのルール名をユーザー定義の名前に置換します。
    マッチング分析で複数のルールを定義する場合は、ダイアログボックスで上向きおよび下向き矢印を使用してルールの順序を変更し、最初に実行するルールを決定できます。
  3. [OK]をクリックします。
    ルールに名前が付けられ、それに基づいてセクション内に並べられます。
  4. [Match threshold] (しきい値の一致)フィールドに、一致可能性のしきい値を入力します。
    確率がこの値を超えると、2つのデータレコードは一致と見なされます。
    [Confident match threshold] (信頼できる一致しきい値)フィールドで、現在の[Match threshold] (一致しきい値)1の間に数値を設定します。
    一致分析によって計算されたGRP-QUALITY[Confident match threshold] (信頼できる一致しきい値)以上の場合は、グループの品質について信頼できます。
  5. [Chart] (チャート)をクリックし、エディターで定義したブロッキングキーとマッチングルールに基づいてグループを計算して、サンプルデータの結果をチャートに表示します。
    分析されたデータの重複値の全体図がこのチャートに表示されます。[Hide groups less than] (次の値未満のグループを非表示)パラメーターは、デフォルトでは、2に設定されています。このパラメーターを使用して、チャートに表示するグループを決定できます。通常は、小さいグループサイズのグループを非表示にします。
    上の図では、1000サンプルを検証し、[Hide groups less than] (次の値未満のグループを非表示)パラメーターを2に設定してユニークな項目を除外した結果、
    • 49あるグループそれぞれに項目が2つずつ存在することを表しています。各グループで、2項目がお互いに重複しています。

    • 7グループで3項目が重複しており、最後のグループで4項目が重複しています。

    また、[Data] (データ)テーブルには各グループの項目一致に関する詳細が示され、一致チャートの色に基づいてグループが色分けされます。