一致分析の作成 - Cloud

Talend Cloud API Services Platform Studio ユーザーガイド

Version
Cloud
Language
日本語 (日本)
EnrichDitaval
API Services Platform
Product
Talend Cloud
Module
Talend Studio
Content
ジョブデザインと開発
マッチング分析では、ブロッキングキーやマッチングキーまたはサバイバーシップルールを使ってデータベース内または区切り付きファイル内のカラムのセットを比較し、類似するレコードのグループを作成できます。

このタスクについて

この分析によって、マッチングルールを作成してデータでテストし、tMatchGroupコンポーネントでマッチングルールを使用する前などに重複値の数を評価できます。現在、同じテーブル内のカラムに対してのみ、マッチングルールをテストできます。

前提条件: Talend Studio Profiling パースペクティブを選択していること。[Metadata] (メタデータ)ノードの下で、データベースかファイル接続が少なくとも1つ定義されていること。

マッチング分析をセットアップするシーケンスには、次の手順が含まれます。

手順

  1. Studioのツリービューの[Metadata] (メタデータ)フォルダーの下で定義されている接続がない場合は、エディター内からデータソースへの接続を作成する。
    詳細は、一致分析の設定をご覧ください。
  2. 一致プロセスを使用して、類似するレコードを検索したいテーブルまたはカラムのグループを定義する。
  3. ブロッキングキーを定義して、比較が必要なペアの数を減らす。
    詳細は、マッチングルールの定義をご覧ください。
  4. グルーピングする類似のレコードに基づいて、マッチングキーと一致メソッドを定義する。詳細は、マッチングルールの定義をご覧ください。
  5. マッチング分析エディターからマッチングルールをエクスポートして、Studioリポジトリーで一元管理する。