編集ルールとサンプル結果の表示 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

手順

  1. 2番目の一致ルールを定義するには、[Matching Key] (マッチングキー)テーブルの右上にカーソルを置き、[+]ボタンをクリックして新規ルールを作成します。
    一致ルールの定義で説明されている手順に従い、マッチングキーを定義します。
    一致ルールエディターで複数の条件を定義すると、分析データでOR一致操作が実行されます。レコードは最初のルールを基に評価され、そこで一致したレコードは2番目のルールでは評価されない、というように続きます。
  2. ボタン([Matching Key] (マッチングキー)または[Match and Survivor] (一致およびサバイバー)セクションの右上)をクリックし、デフォルトのルール名をユーザー定義の名前に置換します。
    一致分析で複数のルールを定義する場合は、ダイアログボックスで上向きおよび下向き矢印を使用してルールの順序を変更し、最初に実行するルールを決定できます。
  3. [OK]をクリックします。
    ルールに名前が付けられ、それに基づいてセクション内に並べられます。
  4. [Match threshold] (スレッショルドの一致)フィールドに、一致可能性のスレッショルドを入力します。
    一致の可能性がこの値を上回る場合、2つのデータレコードは一致します。
    [Confident match threshold] (信頼できる一致スレッショルド)フィールドで、現在の[Match threshold] (一致スレッショルド)1の間に数値を設定します。
    一致分析によって計算されたGRP-QUALITY[Confident match threshold] (信頼できる一致スレッショルド)以上の場合は、グループの品質について信頼できます。
  5. [Chart] (チャート)をクリックし、エディターで定義したブロッキングキーと一致ルールに基づいてグループを計算して、サンプルデータの結果をチャートに表示します。
    分析されたデータの重複値の全体図がこのチャートに表示されます。[Hide groups less than] (次の値未満のグループを非表示)パラメーターは、デフォルトでは、2に設定されています。このパラメーターを使用して、チャートに表示するグループを決定できます。通常は、小さいグループサイズのグループを非表示にします。
    上の図では、1000サンプルを検証し、[Hide groups less than] (次の値未満のグループを非表示)パラメーターを2に設定してユニークなアイテムを除外した結果、
    • 49あるグループそれぞれにアイテムが2つずつ存在することを表しています。各グループで、2アイテムがお互いに重複しています。

    • 7グループで3アイテムが重複しており、最後のグループで4アイテムが重複しています。

    また、[Data] (データ)テーブルには各グループのアイテム一致に関する詳細が示され、一致チャートの色に基づいてグループが色分けされます。