Utiliser des composants de dédoublonnage - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Certains composants de qualité de données vous permettent d'analyser des colonnes dans des bases de données et de regrouper les doublons ou les valeurs correspondantes à l'aide de règles de rapprochement ou d'algorithmes de comparaison. Les composants d'exemple sont le tMatchGroup, le tRecordMatching, tGenKey et le tRuleSurvivorship.

Pour plus d'informations concernant la gestion d'un ensemble de règles de consolidation, consultez Gérer un ensemble de règles de consolidation.

Pour plus d'informations et des Jobs d'exemple concernant les composants de dédoublonnage, consultez le chapitre Data Quality du Guide de référence des Composants Talend ainsi que Nettoyage de fichiers délimités (fichiers csv).

Le projet démo de qualité de données contient des Jobs prêts-à-l'emploi pouvant utiliser des composants de dédoublonnage. Pour plus d'informations, consultez Import du projet démo de qualité de données.