Création de filtres sur les âges et les États - 7.3

Exemples d'utilisation de Talend Data Preparation

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données

Créer un filtre est un moyen rapide d'identifier ou isoler des données.

Vous allez une fois de plus utiliser des filtres pour isoler les données qui vous intéressent le plus dans cet exemple, c'est à dire l'âge et la localisation de vos clients. La zone de profiling de données, dans la partie inférieure droite de l'interface, vous permet d'interagir avec les diagrammes qui illustrent la répartition des données dans les colonnes age et state, et ainsi choisir un intervalle spécifique pour vos données.

Procédure

  1. Cliquez sur l'en-tête de la colonne age pour sélectionner son contenu.

    Dans la zone de profiling des données, vous pouvez voir un diagramme à barres verticales, représentant le nombre d'occurrences de chaque valeur listée dans la colonne.

    Vous constatez que la valeur minimale pour l'âge est de 18 et que la valeur maximale est de 80.

  2. Pour limiter les valeurs d'âges affichées dans la grille et créer un filtre sur les 30-55 ans, vous pouvez au choix :
    • Faire glisser les deux extrémités du sélectionneur d'intervalle sur les valeurs minimales et maximales à afficher.
    • Saisissez directement 30 comme minimum et 55 comme maximum dans les champs correspondants.

    Vous pouvez constater qu'un nouveau filtre vient d'être appliqué sur le jeu de données et que seuls sont affichés les clients qui remplissent la condition d'âge fixée à la fourchette 30-55.

    Les filtres peuvent être créés manuellement en saisissant des valeurs dans la zone de texte de la barre de filtres, mais les diagrammes restent un moyen rapide et efficace d'appliquer des filtres sur les données d'une ou plusieurs colonnes en même temps.

    Maintenant que vous avez une meilleure visibilité sur une tranche d'âge spécifique, vous allez ajouter un second filtre pendant que le premier est toujours actif. Les filtres peuvent être combinés de nombreuses manières. Pour cet exemple, vous allez choisir d'afficher les cinq États ou le nombre de clients est le plus élevé.

  3. Cliquez sur l'en-tête de la colonne state pour sélectionner son contenu.

    Cette fois, les données sont affichées dans un diagramme à barres horizontales dans la zone de profiling de données.

  4. Pour créer un filtre sur les cinq États avec le plus de clients, maintenez la touche Maj enfoncée et cliquez sur California, Texas, Florida, New York et Virginia.

    Comme vous pouvez le voir dans la barre de filtres, le filtre s'est ajouté au premier, et seules les données qui correspondent aux deux à la fois sont conservées dans la grille.

  5. Pour supprimer les données qui ne sont plus utilisées, et ne garder que cet échantillon, cliquez sur la fonction Keep these filtered rows (Conserver ces lignes filtrées) dans le panneau des fonctions.

    Cette fonction est disponible uniquement lorsque l'option Apply changes to: Filtered rows est activée.

  6. Dans la barre de filtres, cliquez sur l'icône représentant une poubelle ou cliquez sur la croix de chaque filtre pour annuler les filtres.

Résultats

L'échantillon affiche désormais une liste restreinte de clients, qui respecte les conditions que vous aviez fixé.