Configurer le processus de filtrage utilisé pour conserver uniquement les paires suspectes libellées - 7.2

Dédoublonnage

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de dédoublonnage

Procédure

  1. Double-cliquez sur le premier composant tFilterRow pour ouvrir sa vue Basic settings.
  2. Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.
  3. Dans le tableau Conditions, ajoutez une condition et renseignez les paramètres de filtrage :
    1. Dans la liste Input Column, sélectionnez la colonne contenant les libellés appliqués aux enregistrements, LABEL dans cet exemple.
    2. Dans la liste Function, sélectionnez Empty.
    3. Dans la liste Operator, sélectionnez = =.
    4. Dans la liste Value, définissez le libellé utilisé pour identifier les doublons, "YES" dans cet exemple.