一致ルールの作成 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

StudioのProfilingパースペクティブから、VSRまたはT-Swooshアルゴリズムを使用して一致ルールを作成し、Studioリポジトリに保存することができます。リポジトリで一元管理された一致ルールは、一致エディターにインポートし、重複レコードをグループ化するために自分のデータでテストできます。一致分析の詳細については、一致分析の作成を参照して下さい。

また、VSRアルゴリズムを使用して定義されたルールは、tMatchGroup設定ウィザードやその他の一致コンポーネント(Hadoopコンポーネントなど)にインポートして、一致ジョブでそのルールを使用することもできます。詳細は、『Talend Components Reference Guide』の「tMatchGroup」ドキュメンテーションを参照して下さい。

2つのアルゴリズムは、次の2つの理由から異なる一致結果を生成します。
  • 第1に、VSRアルゴリズムの最初の入力レコードとして、単純にマスターレコードが選択されます。そのため、一致グループのリストが入力レコードの順番によって異なる場合があります。

  • 第2に、出力レコードはVSRアルゴリズムでは変更されませんが、T-Swooshアルゴリズムでは新しいレコードが作成されます。