Création de filtres sur les âges et les États - Cloud

Exemples simples de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Créer un filtre est un moyen rapide d'identifier ou isoler des données.

Vous allez une fois de plus utiliser des filtres pour isoler les données qui vous intéressent le plus dans cet exemple, c'est à dire l'âge et la localisation de vos clients. La zone de profiling de données, dans la partie inférieure droite de l'interface, vous permet d'interagir avec les diagrammes qui illustrent la répartition des données dans les colonnes age et state, et ainsi choisir un intervalle spécifique pour vos données.

Procédure

  1. Cliquez sur l'en-tête de la colonne age pour sélectionner son contenu.

    Dans la zone de profiling des données, vous pouvez voir un diagramme à barres verticales, représentant le nombre d'occurrences de chaque valeur listée dans la colonne.

    Vous constatez que la valeur minimale pour l'âge est de 18 et que la valeur maximale est de 80.

  2. Pour limiter les valeurs d'âges affichées dans la grille et créer un filtre sur les 30-55 ans, vous pouvez au choix :
    • Faire glisser les deux extrémités du sélectionneur d'intervalle sur les valeurs minimales et maximales à afficher.
    • Saisissez directement 30 comme minimum et 55 comme maximum dans les champs correspondants.

    Vous pouvez constater qu'un nouveau filtre a été appliqué sur le jeu de données et seules les données client qui correspondent à la condition appliquée sur la fourchette d'âges 30-55 sont visibles.

    Les filtres peuvent être créés manuellement en saisissant des valeurs dans la zone de texte de la barre de filtres, mais les diagrammes restent un moyen rapide et efficace d'appliquer des filtres sur les données d'une ou plusieurs colonnes en même temps.

    Maintenant que vous avez une meilleure visibilité sur une tranche d'âge spécifique, vous allez ajouter un second filtre pendant que le premier est toujours actif. Les filtres peuvent être combinés de nombreuses manières. Pour cet exemple, vous allez choisir d'afficher les cinq États ou le nombre de clients est le plus élevé.

  3. Cliquez sur l'en-tête de la colonne state pour sélectionner son contenu.

    Cette fois, les données sont affichées dans un diagramme à barres horizontales dans la zone de profiling de données.

  4. Pour créer un filtre sur les cinq États avec le plus de clients, maintenez la touche Maj enfoncée et cliquez sur California, Texas, Florida, New York et Virginia.

    Comme vous pouvez le voir dans la barre de filtres, le filtre s'est ajouté au premier, et seules les données qui correspondent aux deux à la fois sont conservées dans la grille.

  5. Pour supprimer les données qui ne sont plus utilisées, et ne garder que cet échantillon, cliquez sur la fonction Keep these filtered rows (Conserver ces lignes filtrées) dans le panneau des fonctions.

    Cette fonction n'est disponible que si le bouton radio Apply changes to: Filtered rows (Appliquer sur : Les lignes filtrées) est sélectionné.

  6. Dans la barre de filtres, cliquez sur l'icône représentant une poubelle ou cliquez sur la croix de chaque filtre pour annuler les filtres.

Résultats

L'échantillon affiche désormais une liste restreinte de clients, qui respecte les conditions que vous aviez fixé.