Accéder au contenu principal

Utiliser des composants de dédoublonnage

Certains composants de qualité de données vous permettent d'analyser des colonnes dans des bases de données et de regrouper les doublons ou les valeurs correspondantes à l'aide de règles de rapprochement ou d'algorithmes de comparaison. Les composants d'exemple sont le tMatchGroup, le tRecordMatching, tGenKey et le tRuleSurvivorship.

Pour plus d'informations concernant la gestion d'un ensemble de règles de consolidation, consultez Gestion d'un ensemble de règles de consolidation (uniquement en anglais).

Pour plus d'informations et des Jobs d'exemple concernant les composants de dédoublonnage, consultez le chapitre Data Quality du Guide de référence des Composants Talend ainsi que Nettoyage de fichiers délimités (fichiers CSV) (uniquement en anglais).

Le projet démo de qualité de données contient des Jobs prêts-à-l'emploi pouvant utiliser des composants de dédoublonnage. Pour plus d'informations, consultez Import du projet démo de qualité de données (uniquement en anglais).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !