Filtrage de valeurs à l'aide de diagrammes - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données

L'onglet Chart (Diagramme) affiche une représentation graphique de vos données. Il peut également être utilisé pour filtrer rapidement et simplement vos données.

Selon le type de données ou le type sémantique sélectionné, la représentation graphique de la distribution des valeurs dans l'onglet est différente :

  • des diagrammes à barres verticales pour les données numériques
  • des diagrammes à barres horizontales pour les données textuelles
  • une carte mondiale Continent et Continent Code, Country, Country Code ISO2 et Country Code ISO3
  • une carte d'Amérique du Nord pour North American state et North American state code
  • une carte des États-Unis pour US State et US State Code
  • une cate du Mexique pour MX Estado et MX Estado Code
  • une carte du Canada pour CA Province Territory et CA Province Territory Code
  • une carte de France pour FR Departement, FR Region et FR Region Legacy

Cet exemple utilise un jeu de données contenant des informations clients habituelles, comme leur nom, leur genre, leur e-mail ou le pays dans lequel ils vivent.

Procédure

  1. Sélectionnez une colonne contenant les données textuelles que vous souhaitez filtrer, FIRST_NAME, par exemple.

    Le diagramme à barres horizontales indiquant les occurrences les plus courantes des prénoms s’affiche dans l'onglet Chart (Diagramme).

  2. Cliquez sur la barre supérieure pour appliquer un filtre sur le prénom le plus commun.

    La préparation n'affiche plus que les lignes contenant ce prénom.

    Vous pouvez également utiliser la combinaison Ctrl + Clic ou Maj + Clic pour sélectionner plusieurs valeurs en même temps et appliquer un filtre plus complexe.

  3. Sélectionnez la colonne ISO2_COUNTRY_CODE.

    Cette fois, les données sont affichées sous la forme d'une carte du monde. Plus il y a d'occurrences d'un pays, plus ce dernier sera sombre sur la carte.

    Vous pouvez passer de la vue de la carte à la vue du graphique à barres en cliquant sur les icônes en haut à droite de l'onglet Chart (Diagramme).

  4. Cliquez sur les États-Unis directement sur la carte pour ajouter ce filtre au précédent.

    Les données qui s'affichent correspondent aux deux filtres.

  5. Dans le panneau des fonctions, cliquez sur une fonction afin de l'exécuter sur les données filtrées, Delete these Filtered Rows (Supprimer ces lignes filtrées) par exemple.
  6. Dans la barre de filtre, cliquez sur la croix de chaque filtre ou sur l'icône représentant une poubelle afin d'annuler les filtres et afficher à nouveau le jeu de données complet.