Gérer des tâches de regroupement pour décider des relations entre les paires d'enregistrements

Les tâches de regroupement consistent en la décision d'une relation entre plusieurs enregistrements au sein d'un groupe. Une fois votre choix validé, vous passez la tâche en transition vers le second état défini dans le workflow.

Procédure

Dans la page Tasks (Tâches), cliquez sur le nom de la campagne, Site deduplication dans cet exemple, pour ouvrir la liste des tâches qui vous sont assignées.

Exemple
Vous devez répondre à une question pour confirmer que les paires suspectes d'une liste de centres d'éducation sont vraiment des doublons. Une fois les enregistrements libellés et votre choix validé, un Job Talend récupère les données de la campagne et les utilise dans le contexte d'un rapprochement des données dans Spark.
Sélectionnez une tâche ou utilisez les touches Ctrl/Maj pour sélectionner plusieurs tâches, puis cliquez sur Yes (Oui), No (Non) ou Not sure (Incertain) pour confirmer la relation entre les paires de données.
Les tâches s'affichent en vert, une fois la décision prise. Votre choix est listé dans la colonne Arbitration (Arbitrage).
Cliquez sur Validate choices (Valider les choix) dans le coin supérieur droit de la page afin de valider les choix effectués sur les tâches.

Résultats

Les choix sont configurés, les enregistrements de données sont résolus, validés et déplacés de votre liste.

Que faire ensuite

Utilisez un Job Talend pour analyser les données libellées dans la campagne Site deduplication et générer un modèle de rapprochement.

Pour plus d'informations, consultez le Job relatif à la génération d'un modèle de rapprochement à partir d'une campagne de regroupement, dans les scénarios d'apprentissage automatique.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !

Laissez vos commentaires ici