さまざまなソースからのデータの調整 - Cloud

Talend Cloud Data Stewardship入門ガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データガバナンス > キャンペーンの管理
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理
データクオリティとプレパレーション > 重複データの削除
EnrichPlatform
Talend Data Stewardship
ソリューションの1つTalend Cloud Data Stewardshipでは[Merging] (マージング)キャンペーンを使用して、データのマッチングとクレンジングを行ってマスターデータを作成できます。

このユースケースでは、さまざまなソースからのデータのマッチングとクレンジングを行ってマスターレコードを作成する方法を説明しています。

顧客データのデータ品質や異常の問題に直面しているとしましょう。企業で使用されているさまざまなCRM間で同期が取れていないため、重複している情報が見つかりました。[Merging] (マージング)キャンペーンを使用すると、適切なデータだけを存続させて重複を解決できます。

ただし、次の2つの側面を考慮する必要があります:
  • 重複の可能性のあるレコードをグループ化する一致グループはどのように特定しますか?この質問は、StudioでTalendジョブを使用して解決できます。
  • データソースから最適な属性値を選択し、ユーザーとシステムが利用できる最も正確で信頼性の高いマスターレコードを作成するにはどのようにしたらいいですか? この問題は、Talend Data Stewardship[Merging] (マージング)キャンペーンを使うことで解決できます。

サンプルを再現して正確な顧客データを使用するために、キャンペーン所有者が入力ファイルおよびこのサンプルで使用するTalendジョブを既にダウンロードしていることを前提とします。これをタスクを使用して、作成されたキャンペーンにタスクを読み込むことができます。

このページの左パネルにある[Downloads] (ダウンロード)タブからtds_gettingstarted_source_files.zipファイルを取得します。