Écrire des tâches dans une campagne Merging - Cloud

Écrire des tâches dans une campagne Merging - Cloud - 8.0

Data Stewardship

Version

Cloud

8.0

Language

Français

Product

Talend Big Data

Talend Big Data Platform

Talend Data Fabric

Talend Data Integration

Talend Data Management Platform

Talend Data Services Platform

Talend ESB

Talend MDM Platform

Talend Real-Time Big Data Platform

Module

Studio Talend

Talend Data Stewardship

Content

Création et développement > Systèmes tiers > Composants Data Stewardship

Gouvernance de données > Systèmes tiers > Composants Data Stewardship

Qualité et préparation de données > Systèmes tiers > Composants Data Stewardship

Last publication date

2024-02-21

Ce Job charge des tâches dans une campagne Merging définie dans Talend Data Stewardship selon les critères que vous avez définis dans les paramètres simples (Basic settings) du composant tDataStewardshipTaskOutput.

Les enregistrements de données dans ces tâches contiennent des doublons. Talend Data Stewardship vous permet de fusionner les données redondantes et créer des enregistrements maître basés sur des scores de confiance que vous pouvez définir lors de la création de la campagne.

Une fois les données chargées dans la campagne, les participants autorisés peuvent intervenir et configurer manuellement des règles de consolidation par attribut dans les enregistrements de données ou saisir des valeurs entièrement nouvelles lors de la résolution des tâches.

Il est également possible d'effectuer un calcul dynamique du score de confiance d'un enregistrements donné en se basant sur des règles métier embarquées dans le Job. Dans une telle situation, vous devez fournir le score de confiance pour un ou plusieurs enregistrement(s) et le(s) mapper vers la colonne de sortie TDS_RATING dans le tDataStewardshipTaskOutput. Ces scores de confiance écrasent les éventuels scores définis lors de la création de la campagne.

Pour plus de technologies supportées par Talend, consultez Composants Talend.

Ce scénario s'applique uniquement aux produits Talend nécessitant souscription.

Dans ce Job :

Le composant tFileInputDelimited lit les données clients.
Le composant tMatchGroup compare les données en utilisant des méthodes de rapprochement et de bloc. Il crée également des groupes de doublons rencontrés.
Le composant tMap mappe l'identifiant du groupe, GID, généré par le tMatchGroup à TDS_GID.

Lorsque les données d'entrée ont une colonne contenant le nom des sources de données, le tMap peut également mapper la colonne d'entrée vers TDS_SOURCE.
Le composant tDataStewardshipTaskOutput écrit les données dans la campagne CRM Data Deduplication dans Talend Data Stewardship.