Utilisation de la barre de statistiques - 2.8

Guide de prise en main de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
7.1
2.8
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

La façon la plus rapide d'identifier les données invalides est de regarder la barre de statistiques.

En dessous de chaque en-tête de colonne se situe une barre de statistiques, affichant la quantité de cellules contenant des données valides, invalides, ou bien vides. Chaque catégorie est représentée par une couleur :

  • vert pour les données qui correspondent au type de la colonne,
  • blanc pour les cellules vides,
  • orange pour les données qui ne correspondent pas au type de la colonne.

Cliquez sur l'une des couleurs pour sélectionner, supprimer ou bien vider les cellules avec des données qui possèdent un format invalide. Passer votre souris sur l'une des couleurs vous permet d'afficher le nombre exact de lignes dans cette catégorie, tout comme le pourcentage qu'il représente dans la colonne.

En regardant la barre de statistiques sous l'en-tête de la colonne Email, vous pouvez constater qu'il y a des cellules vides et des valeurs invalides parmi vos données. Vous allez les supprimer.

Pour utiliser la barre de statistiques et supprimer les lignes qui contiennent des cellules invalides, procédez comme suit :

Procédure

  1. Cliquez sur la partie blanche de la barre de statistiques, dans l'en-tête de la colonne Email.

    Un menu déroulant s'affiche.

  2. Cliquez sur Delete the rows with empty cell (Supprimer les lignes ayant une cellule vide).

    Les cellules vides de la colonne Email ont été supprimées et seules les valeurs invalides, représentées en orange, sont encore présentes.

  3. Répétez les deux dernières étapes, mais cette fois, cliquez sur la partie orange de la barre de statistiques et sélectionnez Delete the rows with invalid cell (Supprimer les lignes contenant une cellule invalide).

    La colonne Email ne contient plus aucune valeur invalide ou cellule vide.

  4. Utilisez la barre de statistiques pour supprimer les cellules invalides des colonnes Zip et Phone.

Résultats

La colonne State est maintenant la dernière à contenir des cellules invalides, mais vous allez la traiter d'une manière différente.