Gérer des tâches de regroupement pour décider des relations entre les paires d'enregistrements - 8.0

Exemples d'utilisation de Talend Data Stewardship

Version
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Content
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
Last publication date
2024-04-15
Les tâches de regroupement consistent en la décision d'une relation entre plusieurs enregistrements au sein d'un groupe. Une fois votre choix validé, vous passez la tâche en transition vers le second état défini dans le workflow.

Procédure

  1. Dans la page Tasks (Tâches), cliquez sur le nom de la campagne, Site deduplication dans cet exemple, pour ouvrir la liste des tâches qui vous sont assignées.

    Exemple

    Vous devez répondre à une question pour confirmer que les paires suspectes d'une liste de centres d'éducation sont vraiment des doublons. Une fois les enregistrements libellés et votre choix validé, un Job Talend récupère les données de la campagne et les utilise dans le contexte d'un rapprochement des données dans Spark.
  2. Sélectionnez une tâche ou utilisez les touches Ctrl/Maj pour sélectionner plusieurs tâches, puis cliquez sur Yes (Oui), No (Non) ou Not sure (Incertain) pour confirmer la relation entre les paires de données.
    Les tâches s'affichent en vert, une fois la décision prise. Votre choix est listé dans la colonne Arbitration (Arbitrage).
  3. Cliquez sur Validate choices (Valider les choix) dans le coin supérieur droit de la page afin de valider les choix effectués sur les tâches.

Résultats

Les choix sont configurés, les enregistrements de données sont résolus, validés et déplacés de votre liste.

Que faire ensuite

Utilisez un Job Talend pour analyser les données libellées dans la campagne Site deduplication et générer un modèle de rapprochement.

Pour plus d'informations, consultez le Job relatif à la génération d'un modèle de rapprochement à partir d'une campagne de regroupement, dans les scénarios d'apprentissage automatique.