マージングキャンペーンでタスクを作成 - 7.3

Data Stewardship

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Data Stewardship
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > データスチュワードシップコンポーネント
データガバナンス > サードパーティーシステム > データスチュワードシップコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データスチュワードシップコンポーネント

このジョブではTalend Data Stewardshipで定義される[Merging] (マージング)キャンペーンのタスクをtDataStewardshipTaskOutputコンポーネントの基本設定で定義した条件に基づいてロードします。

これらのタスクのデータレコードは重複しています。Talend Data Stewardshipではキャンペーンを作成する時に定義できるトラストスコアに基づいて、冗長データをマージし、マスターレコードを作成できます。

キャンペーンにデータをロードした後、権限のあるキャンペーン参加者はデータレコードの属性ごとにサバイバーシップルールを手動で設定するか、まったく新しい値を入力してタスクを解決できます。

また、ジョブに組み込まれたいくつかのビジネスルールに基づいて、特定のレコードのトラストスコアを動的に計算することもできます。このようなシナリオでは、1つ以上のレコードに対してトラストスコアを指定し、tDataStewardshipTaskOutputTDS_RATING出力カラムにマッピングする必要があります。これらのトラストスコアにより、キャンペーン作成時に定義されたスコアが上書きされます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオは、サブスクリプションベースのTalend製品にのみ適用されます。

このジョブでは次のように処理されます:

  • tFileInputDelimitedコンポーネントで顧客データを読み取ります。

  • tMatchGroupコンポーネントでマッチングおよびブロッキングメソッドを使用してデータを比較し、同様に検出された重複レコードのグループを作成します。

  • tMapコンポーネントでグループ識別子GID (tMatchGroupで生成)をTDS_GIDにマッピングします。

    入力データにデータソースの名前が含まれるカラムが存在する場合、tMapで、入力カラムをTDS_SOURCEにマッピングすることもできます。

  • tDataStewardshipTaskOutputコンポーネントが Talend Data Stewardship[CRM Data Deduplication] (CRMデータ重複除去)のキャンペーンにデータを書き込みます。