Sélectionner les colonnes qui vous intéressent - 7.0

Deduplication

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Le schéma du tRuleSurvivorship comprend différentes colonnes techniques, comme GID, GRP_SIZE, qui ne sont pas pertinentes dans cet exemple. Utilisez donc le tFilterColumns pour gérer ces colonnes techniques. Les colonnes contenant les données seront écrites en sortie. Pour ce faire, procédez comme suit :

Procédure

  1. Double-cliquez sur le tFilterColumns pour ouvrir sa vue Component.
  2. Cliquez sur Sync columns pour récupérer le schéma du composant précédent. Si une boîte de dialogue s'ouvre et vous demande de propager, cliquez sur Yes pour accepter.
  3. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur de schéma.
  4. Du côté tFilterColumns de l'éditeur, sélectionnez les lignes GID, GRP_SIZE, MASTER et SCORE puis cliquez sur le bouton avec une croix rouge afin de les supprimer.
  5. Cliquez sur OK pour valider ces modifications et accepter la propagation proposée par la boîte de dialogue.