Écrire des tâches dans une campagne Merging - 7.1

Data Stewardship

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Stewardship
Gouvernance de données > Systèmes tiers > Composants Data Stewardship
Qualité et préparation de données > Systèmes tiers > Composants Data Stewardship
EnrichPlatform
Studio Talend
Talend Data Stewardship

Ce Job charge des tâches dans une campagne Merging définie dans Talend Data Stewardship selon les critères que vous avez définis dans les paramètres simples (Basic settings) du composant tDataStewardshipTaskOutput.

Les enregistrements de données dans ces tâches contiennent des doublons, mais Talend Data Stewardship peut fusionner les données redondantes et créer des enregistrements maître basés sur des scores de confiance que vous pouvez définir lors de la création de la campagne dans l'application. Une fois les données chargées dans la campagne, les participants autorisés peuvent intervenir et configurer manuellement des règles de consolidation par attribut dans les enregistrements de données ou saisir des valeurs entièrement nouvelles lors de la résolution des tâches.

Il est également possible d'effectuer un calcul dynamique du score de confiance d'un enregistrements donné en se basant sur des règles métier embarquées dans le Job. Dans une telle situation, vous devez fournir le score de confiance pour un ou plusieurs enregistrement(s) et le(s) mapper vers la colonne de sortie TDS_RATING dans le tDataStewardshipTaskOutput. Ces scores de confiance écrasent les éventuels scores définis lors de la création de la campagne.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Ce scénario s'applique uniquement aux solutions Talend nécessitant souscription.

Dans ce Job :

  • Le composant tFileInputDelimited lit les données clients.

  • Le composant tMatchGroup compare les données en utilisant des méthodes de rapprochement et de bloc. Il crée également des groupes de doublons rencontrés.

  • Le composant tMap mappe l'identifiant du groupe, GID, généré par le tMatchGroup à TDS_GID.

    Lorsque les données d'entrée ont une colonne contenant le nom des sources de données, le tMap peut également mapper la colonne d'entrée vers TDS_SOURCE.

  • Le composant tDataStewardshipTaskOutput écrit les données dans la campagne CRM Data Deduplication dans Talend Data Stewardship.