マージングキャンペーンのタスクの作成 - 7.3

Data Stewardship

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データスチュワードシップコンポーネント
データガバナンス > サードパーティーシステム > データスチュワードシップコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データスチュワードシップコンポーネント
Last publication date
2024-02-22

このジョブではTalend Data Stewardshipで定義される[Merging] (マージング)キャンペーンのタスクをtDataStewardshipTaskOutputコンポーネントの基本設定で定義した条件に基づいてロードします。

タスクのデータレコードは重複します。Talend Data Stewardshipではキャンペーンを作成する時に定義できるトラストスコアに基づいて、冗長データをマージし、マスターレコードを作成できます。

キャンペーンにデータをロードした後、権限のあるキャンペーン参加者はデータレコードの属性ごとにサバイバーシップルールを手動で設定するか、まったく新しい値を入力してタスクを解決できます。

また、ジョブに組み込まれたいくつかのビジネスルールに基づいて、特定のレコードのトラストスコアを動的に計算することもできます。このようなシナリオでは、1つ以上のレコードに対してトラストスコアを指定し、tDataStewardshipTaskOutputTDS_RATING出力カラムにマッピングする必要があります。これらのトラストスコアにより、キャンペーン作成時に定義されたスコアが上書きされます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

このシナリオは、全Talend製品に適用されます。

このジョブでは次のように処理されます:

  • tFileInputDelimitedコンポーネントで顧客データを読み取ります。

  • tMatchGroupコンポーネントでマッチングおよびブロッキングメソッドを使用してデータを比較し、同様に検出された重複レコードのグループを作成します。

  • tMapコンポーネントでグループ識別子GID (tMatchGroupで生成)をTDS_GIDにマッピングします。

    入力データにデータソースの名前が含まれるカラムが存在する場合、tMapで、入力カラムをTDS_SOURCEにマッピングすることもできます。

  • tDataStewardshipTaskOutputコンポーネントがTalend Data Stewardship[CRM Data Deduplication] (CRMデータ重複除去)のキャンペーンにデータを書き込みます。