対象製品...
Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
手順
-
2番目のマッチングルールを定義するには、[Matching Key] (マッチングキー)テーブルの右上にカーソルを置き、[+]ボタンをクリックして新規ルールを作成します。
マッチングルールを定義で説明されている手順に従い、マッチングキーを定義します。マッチングルールエディターで複数の条件を定義すると、分析データでORマッチング操作が実行されます。レコードは最初のルールを基に評価され、そこで一致したレコードは2番目のルールでは評価されない、というように続きます。
-
ボタン([Matching Key] (マッチングキー)または[Match and Survivor] (一致およびサバイバー)セクションの右上)をクリックし、デフォルトのルール名をユーザー定義の名前に置換します。
マッチング分析で複数のルールを定義する場合は、ダイアログボックスで上向きおよび下向き矢印を使用してルールの順序を変更し、最初に実行するルールを決定できます。 -
[OK]をクリックします。
ルールに名前が付けられ、それに基づいてセクション内に並べられます。
-
[Match threshold] (しきい値の一致)フィールドに、一致可能性のしきい値を入力します。
確率がこの値を超えると、2つのデータレコードは一致と見なされます。[Confident match threshold] (信頼できるマッチングしきい値)フィールドで、現在の[Match threshold] (マッチングしきい値)と
1
の間に数値を設定します。一致分析によって計算されたGRP-QUALITYが[Confident match threshold] (信頼できるマッチングしきい値)以上の場合は、グループのクオリティについて信頼できます。 -
[Chart] (チャート)をクリックし、エディターで定義したブロッキングキーとマッチングルールに基づいてグループを計算して、サンプルデータの結果をチャートに表示します。
分析されたデータの重複値の全体図がこのチャートに表示されます。[Hide groups less than] (次の値未満のグループを非表示)パラメーターは、デフォルトでは、2に設定されています。このパラメーターを使用して、チャートに表示するグループを決定できます。通常は、小さいグループサイズのグループを非表示にします。上の図では、1000サンプルを検証し、[Hide groups less than] (次の値未満のグループを非表示)パラメーターを2に設定してユニークな項目を除外した結果、
-
49あるグループそれぞれに項目が2つずつ存在することを表しています。各グループで、2項目がお互いに重複しています。
-
7グループで3項目が重複しており、最後のグループで4項目が重複しています。
また、[Data] (データ)テーブルには各グループの項目一致に関する詳細が示され、一致チャートの色に基づいてグループが色分けされます。 -