Utiliser des composants de dédoublonnage - 6.1

Talend Data Services Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Data Services Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Certains composants de qualité de données vous permettent d'analyser des colonnes dans des bases de données et de regrouper les doublons ou les valeurs correspondantes à l'aide de règles de mise en correspondance ou d'algorithmes de comparaison. Par exemple, le tMatchGroup, le tMatchGroupHadoop, le tRecordMatching, le tGenKey, le tSurviveFields et le tRuleSurvivorship.

Pour plus d'informations concernant la gestion d'un ensemble de règles d'arbitrage, consultez Gestion d'un ensemble de règles de consolidation.

Pour plus d'informations et des Jobs d'exemple concernant les composants de dédoublonnage, consultez le chapitre Data Quality du Guide de référence des Composants Talend ainsi que la Nettoyage de fichiers délimités (fichiers csv).

Note

Le projet démo de qualité de données contient des Jobs prêts-à-l'emploi pouvant utiliser des composants de standardisation. Pour plus d'informations, consultez Import du projet démo de qualité de données.