Création de filtres sur les âges et les États - 7.3

Exemples d'utilisation de Talend Data Preparation

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données
Last publication date
2023-08-08

Créer un filtre est un moyen rapide d'identifier ou isoler des données.

Vous allez encore une fois utiliser les filtres pour isoler les données les plus pertinentes dans cet exemple, à savoir l'âge et l'emplacement de vos client·es. La zone de profiling de données, en bas à droite de l'interface vous permet d'interagir avec les diagrammes illustrant les données des colonnes age et state et de sélectionner un intervalle spécifique de dates.

Procédure

  1. Cliquez sur l'en-tête de la colonne age pour sélectionner son contenu.

    Dans la zone de profiling de données, en bas à droite de l'écran, vous pouvez voir un diagramme à barres verticales affichant le nombre d'occurrences de chaque valeur listée dans la colonne.

    Vous constatez que la valeur minimale pour l'âge est de 18 et que la valeur maximale est de 80.

  2. Pour limiter les valeurs des âges affichés dans la grille et créer un filtre sur l'intervalle 30-55, vous pouvez :
    • glisser les deux extrémités du curseur afin de sélectionner les valeurs minimale et maximale à afficher,
    • saisir 30 comme valeur minimale et 55 comme valeur maximale, directement dans les champs dédiés.

    Vous pouvez constater qu'un nouveau filtre a été appliqué sur le jeu de données. Les données client·es sont affichées uniquement si elles correspondent aux conditions spécifiées de l'intervalle d'âge 30-55.

    Les filtres peuvent être créés manuellement en saisissant des valeurs dans la zone de texte de la barre de filtre, mais les diagrammes sont un moyen rapide et pratique d'appliquer des filtres sur vos données, pour une colonne ou pour plusieurs à la fois.

    Maintenant que vous avez une vision d'un groupe d'âge spécifique, vous allez ajouter un second filtre. Les filtres peuvent être combinés de bien des façons. Ici, choisissez d'afficher les cinq États ayant le plus grand nombre de clients.

  3. Cliquez sur l'en-tête de la colonne state pour sélectionner son contenu.

    Cette fois, les données sont affichées sous la forme d'un diagramme à barres horizontales dans la zone de profiling.

  4. Pour créer un filtre sur les cinq États avec le plus de clients, maintenez la touche Maj enfoncée et cliquez sur California, Texas, Florida, New York et Virginia.

    Comme vous pouvez le voir dans la barre de filtre, le filtre est appliqué par-dessus le premier. Seules les données correspondant aux deux filtres sont affichées dans la grille.

  5. Pour supprimer les données qui ne sont plus utilisées, et ne garder que cet échantillon, cliquez sur la fonction Keep these filtered rows (Conserver ces lignes filtrées) dans le panneau des fonctions.

    Cette fonction est disponible uniquement lorsque l'option Apply changes to: Filtered rows est activée.

  6. Dans la barre de filtres, cliquez sur l'icône représentant une poubelle ou cliquez sur la croix de chaque filtre pour annuler les filtres.

Résultats

Votre échantillon affiche à présent une liste restreinte de client·es, correspondant aux conditions définies.