Suppression de tous les enregistrements vides et invalides

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend MDM Platform
Talend Real-Time Big Data Platform
Talend Data Services Platform
Talend Big Data
Talend Data Management Platform
Talend Data Fabric
Talend ESB
Talend Data Integration
Talend Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

La barre de statistiques est un outil pratique pour filtrer et supprimer les données invalides d'une colonne, mais il est aussi possible d'effectuer ce nettoyage à l'échelle du jeu de données.

Vous pouvez appliquer un filtre sur tous les enregistrements vides et invalides de votre jeu de données et les supprimer en une seule action.

Prenons l'exemple d'un jeu de données contenant des informations clients, où certains numéros de téléphone et addresses e-mail sont soit invalides, soit absents.

Procédure

  1. Cliquez sur la flèche blanche en haut à gauche de la grille.
  2. Sélectionnez Display rows with invalid or empty values.

    Le filtre a été appliqué et la grille n'affiche désormais que les lignes qui contiennent au moins une cellule vide ou invalide.

    Vous pouvez également choisir de ne filtrer que les enregistrements vides ou invalides afin de les supprimer du jeu de données.

  3. Dans le panneau des fonctions, cliquez sur la fonction Delete these Filtered Rows.

    Les lignes filtrées sont supprimées et vous pouvez à présent enlever le filtre.

  4. Dans la barre de filtre, cliquez sur la croix a droite du filtre ou sur l'icône représentant une poubelle afin d'annuler le filtre et afficher à nouveau le jeu de données complet.

Résultats

Votre jeu de données ne contient désormais plus aucuns enregistrements vides ou invalides, et la barre de statistique est entièrement verte pour toutes les colonnes.