Gérer des tâches de regroupement pour décider des relations entre les paires d'enregistrements - Cloud

Exemples de Talend Cloud Data Stewardship

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Stewardship
task
Gouvernance de données > Affectation des tâches
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Gestion des tâches
Les tâches de regroupement consistent en la décision d'une relation entre plusieurs enregistrements au sein d'un groupe. Une fois votre choix validé, vous passez la tâche en transition vers le second état défini dans le workflow.

Procédure

  1. Dans la page TASKS, cliquez sur le nom de la campagne, Site deduplication dans cet exemple, pour ouvrir la liste des tâches qui vous sont assignées.

    Exemple

    Vous devez répondre à une question pour confirmer que les paires suspectes d'une liste de centres d'éducation sont vraiment des doublons. Une fois les enregistrements libellés et votre choix validé, un Job Talend récupère les données de la campagne et les utilise dans le contexte d'un rapprochement des données dans Spark.
  2. Sélectionnez une tâche ou utilisez les touches Ctrl/Maj pour sélectionner plusieurs tâches, puis cliquez sur Yes (Oui), NO (NON) ou NOT SURE (INCERTAIN) pour confirmer la relation entre les paires de données.
    Les tâches s'affichent en vert, une fois la décision prise. Votre choix est listé dans la colonne ARBITRATION.
  3. Cliquez sur VALIDATE CHOICES dans le coin supérieur droit de la page afin de valider les choix effectués sur les tâches.

Résultats

Les choix sont configurés, les enregistrements de données sont résolus, validés et déplacés de votre liste.

Que faire ensuite

Utilisez un Job Talend pour analyser les données libellées dans la campagne Site deduplication et générer un modèle de rapprochement.

Pour plus d'informations, consultez le Job relatif à la génération d'un modèle de rapprochement à partir d'une campagne de regroupement, dans les scénarios d'apprentissage automatique.