Nettoyage de données
Une fois votre préparation sauvegardée, vous pouvez commencer à travailler sur les données clients, comme sur tout autre jeu de données et choisir des fonctions parmi les fonctions courantes.
Le jeu de données que vous importez contient à l'origine 20 000 lignes, mais seul un échantillon des 10 000 premières lignes est affiché par défaut. Cependant, les étapes de préparation seront appliquées au jeu de données complet.
Vous allez effectuer des opérations de nettoyage simples, pour vous assurer que toutes les données contenues dans le jeu de données sont valides et ne contiennent pas d'erreur.
Par exemple, vous pouvez constater la présence d'espaces inutiles dans certaines entrées des colonnes First_Name et Last_Name.
La barre de statistiques sous chaque colonne indique que vos données contiennent des lignes avec des cellules vides ou invalides. La colonne Email, par exemple, contient les deux.
Vous allez supprimer les lignes vides et invalides de la préparation en une action et vous allez supprimer les erreurs de formatage dans les colonnes contenant les noms des clients.
Procédure
Résultats
En deux actions simples, vous avez supprimé toutes les erreurs contenues dans votre jeu de données et avez amélioré la qualité de vos données.
La barre de statistiques de chaque colonne est à présent complètement verte, ce qui indique qu'il ne reste aucune donnée invalide dans votre préparation.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !