マッチング分析の作成 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio
マッチング分析では、ブロッキングキーやマッチングキーまたはサバイバーシップルールを使ってデータベース内または区切り記号付きファイル内のカラムのセットを比較し、類似するレコードのグループを作成できます。

このタスクについて

この分析によって、一致ルールを作成してデータでテストし、tMatchGroupコンポーネントで一致ルールを使用する前などに重複値の数を評価できます。現在、同じテーブル内のカラムに対してのみ、一致ルールをテストできます。

前提条件: StudioのProfilingパースペクティブを選択していること。[Metadata] (メタデータ)ノードの下に、データベースかファイル接続が少なくとも1つ定義されていること。詳細は、データベースへの接続を参照して下さい。

マッチング分析をセットアップするシーケンスには、次の手順が含まれます。

手順

  1. Studioのツリービューの[Metadata] (メタデータ)フォルダーの下で定義されている接続がない場合は、エディター内からデータソースへの接続を作成する。
    詳細は、マッチング分析の設定を参照して下さい。
  2. 一致プロセスを使用して、類似するレコードを検索したいテーブルまたはカラムのグループを定義する。
  3. ブロッキングキーを定義して、比較が必要なペアの数を減らす。
    詳細は、一致ルールの定義を参照して下さい。
  4. グループ化する類似のレコードに基づいて、一致キーと一致メソッドを定義する。詳細は、一致ルールの定義を参照して下さい。
  5. マッチング分析エディターから一致ルールをエクスポートして、Studioリポジトリーで一元管理する。