Vérifier les composants de transformation - 7.0

Deduplication

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tSortRow afin d'ouvrir sa vue Component.
    Ce composant garde la configuration utilisée dans le Job d'origine. Il trie les données d'entrée par ordre alphabétique à partir des colonnes FirstName et LastName.
  2. Double-cliquez sur le tUniqRow pour ouvrir sa vue Component.
    Le composant garde également la configuration utilisée dans le Job d'origine. Il sépare les données d'entrées en un flux Uniques et un flux Duplicates (Doublons), puis envoie les données uniques dans le tHDFSOutput et les doublons dans le tJDBCOutput.