さまざまなソースからのデータを照合 - 8.0

Talend Data Stewardship入門ガイド

Version
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Content
データガバナンス > キャンペーンの管理
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理
データクオリティとプレパレーション > 重複データの削除
Last publication date
2024-03-04
ソリューションの1つTalend Data Stewardshipでは[Merging] (マージング)キャンペーンを使用して、データのマッチングとクレンジングを行ってマスターデータを作成できます。

このユースケースでは、さまざまなソースからのデータのマッチングとクレンジングを行ってマスターレコードを作成する方法を説明しています。

顧客データのデータクオリティや異常の問題に直面しているとしましょう。企業で使用されているさまざまなCRM間で同期が取れていないため、重複している情報が見つかりました。[Merging] (マージング)キャンペーンを使用すると、適切なデータだけを存続させて重複を解決できます。

ただし、次の2つの側面を考慮する必要があります:
  • 重複の可能性のあるレコードをグルーピングする一致グループはどのように特定しますか?この質問は、TalendTalend Studioジョブを使って解決されます。
  • データソースから最適な属性値を選択し、ユーザーとシステムが利用できる最も正確で信頼性の高いマスターレコードを作成するにはどのようにしたらいいですか? この問題は、Talend Data Stewardship[Merging] (マージング)キャンペーンを使うことで解決できます。

サンプルを再現して正確な顧客データを使用するために、キャンペーン所有者が入力ファイルおよびこのサンプルで使用するTalendジョブを既にダウンロードしていることを前提とします。これをタスクを使用して、作成されたキャンペーンにタスクを読み込むことができます。

tds_gettingstarted_source_files.zipファイルをダウンロードします。