Big Data Platform
Cloud API Services Platform
Cloud Big Data Platform
Cloud Data Fabric
Cloud Data Management Platform
Data Fabric
Data Management Platform
Data Services Platform
MDM Platform
Real-Time Big Data Platform
手順
- ルールエディターの[Matching Key] (マッチングキー)テーブルで、[+]ボタンをクリックしてテーブルに行を追加します。
-
次のようにマッチングキーのパラメーターを設定します。
-
Match Key Name (マッチキー名): マッチキーの任意の名前を入力します。
-
Matching Function (マッチングファンクション): ドロップダウンリストから、実行するマッチングのタイプを選択します。外部のユーザー定義マッチングアルゴリズムを使用する場合は、[Custom] (カスタム)を選択します。
この例では2つのマッチングキーが定義されており、ファーストネームとラストネームにそれぞれ[Levenshtein]と[Jaro-Winkler]という一致メソッドを使用して重複レコードを取得します。
-
[Custom Matcher] (カスタムマッチャー): この項目は[Custom] (カスタム)マッチングファンクションとのみ使われます。ユーザー定義アルゴリズムのJarファイルを参照して選択します。
-
Confidence Weight (信頼度の重み): マッチキーとして使用する列に数値の重み(1から10)を設定します。この値を使用すると、マッチングを実行する時に特定の列の重要度が高くなります。
-
Handle Null (Nullの処理): Null値を含むデータレコードの処理方法を指定します。
マッチングルールのパラメーターの詳細は、tMatchGroupのドキュメンテーションをご覧ください。 -
-
[Match threshold] (しきい値の一致)フィールドに、一致可能性のしきい値を入力します。確率がこの値を超えると、2つのデータレコードは一致と見なされます。
[Confident match threshold] (信頼できるマッチングしきい値)フィールドで、現在の[Match threshold] (マッチングしきい値)と
1
の間に数値を設定します。このしきい値を超えていれば、グループのクオリティは信頼できます。 -
2番目のマッチングルールを定義するには、[Matching Key] (マッチングキー)テーブルの右上にカーソルを置き、[+]ボタンをクリックします。
手順に従ってマッチングルールを作成します。マッチングルールエディターで複数の条件を定義すると、分析データでORマッチング操作が実行されます。レコードは最初のルールを基に評価され、そこで一致したレコードは2番目のルールでは評価されません。
- オプション:
ルールのデフォルト名を変更したい場合は、テーブルの右上にカーソルを置き、
ボタンをクリックします。
また、ダイアログボックスで上向きおよび下向き矢印を使用してルールの順序を変更し、最初に実行するルールを決定できます。 -
OKをクリックします。
ルールに名前が付けられ、それに基づいて[Matching Key] (マッチングキー)テーブルに並べられます。
-
マッチングルール設定を保存します。
マッチングルールは、[DQ Repository] (DQリポジトリー)ツリービューの[Libraries] (ライブラリー) > [Rule] (ルール) > [Match] (一致)の下に保存され一元管理されます。