Création de filtres sur les âges et les États - Cloud

Exemples d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-04-08

Créer un filtre est un moyen rapide d'identifier ou isoler des données.

Vous allez encore une fois utiliser les filtres pour isoler les données les plus pertinentes dans cet exemple, à savoir l'âge et l'emplacement de vos client·es. La zone de profiling de données, en bas à droite de l'interface vous permet d'interagir avec les diagrammes illustrant les données des colonnes age et state et de sélectionner un intervalle spécifique de dates.

Procédure

  1. Cliquez sur l'en-tête de la colonne age pour sélectionner son contenu.

    Dans la zone de profiling de données, en bas à droite de l'écran, vous pouvez voir un diagramme à barres verticales affichant le nombre d'occurrences de chaque valeur listée dans la colonne.

    Diagramme à barres affichant la répartition des valeurs dans la colonne age.

    Vous constatez que la valeur minimale pour l'âge est de 18 et que la valeur maximale est de 80.

  2. Pour limiter les valeurs des âges affichés dans la grille et créer un filtre sur l'intervalle 30-55, vous pouvez :
    • glisser les deux extrémités du curseur afin de sélectionner les valeurs minimale et maximale à afficher,
      Diagramme à barres affichant la répartition des valeurs dans la colonne age, filtrées pour n'afficher que les valeurs entre 30 et 55.
    • saisir 30 comme valeur minimale et 55 comme valeur maximale, directement dans les champs dédiés.

    Vous pouvez constater qu'un nouveau filtre a été appliqué sur le jeu de données. Les données client·es sont affichées uniquement si elles correspondent aux conditions spécifiées de l'intervalle d'âge 30-55.

    Un filtre est appliqué, pour n'afficher que les valeurs de la colonne age dont la valeur est comprise entre 30 et 55.

    Les filtres peuvent être créés manuellement en saisissant des valeurs dans la zone de texte de la barre de filtre, mais les diagrammes sont un moyen rapide et pratique d'appliquer des filtres sur vos données, pour une colonne ou pour plusieurs à la fois.

    Maintenant que vous avez une vision d'un groupe d'âge spécifique, vous allez ajouter un second filtre. Les filtres peuvent être combinés de bien des façons. Ici, choisissez d'afficher les cinq États ayant le plus grand nombre de clients.

  3. Cliquez sur l'en-tête de la colonne state pour sélectionner son contenu.

    Cette fois, les données sont affichées sous la forme d'un diagramme à barres horizontales dans la zone de profiling.

    Diagramme à barres affichant la répartition des valeurs dans la colonne state.
  4. Pour créer un filtre sur les cinq États avec le plus de clients, maintenez la touche Maj enfoncée et cliquez sur California, Texas, Florida, New York et Virginia.
    Diagramme à barres affichant la répartition des valeurs dans la colonne state, avec un filtre sur cinq États.

    Comme vous pouvez le voir dans la barre de filtre, le filtre est appliqué par-dessus le premier. Seules les données correspondant aux deux filtres sont affichées dans la grille.

    Deux filtres sont appliqués, pour n'afficher que les valeurs des colonnes age et state .
  5. Pour supprimer les données qui ne sont plus utilisées, et ne garder que cet échantillon, cliquez sur la fonction Keep these filtered rows (Conserver ces lignes filtrées) dans le panneau des fonctions.

    Cette fonction est disponible uniquement lorsque l'option Apply changes to: Filtered rows est activée.

  6. Dans la barre de filtres, cliquez sur l'icône représentant une poubelle ou cliquez sur la croix de chaque filtre pour annuler les filtres.

Résultats

Votre échantillon affiche à présent une liste restreinte de client·es, correspondant aux conditions définies.