Filtrer les tâches à l'aide des modèles - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-04-16
L'onglet Pattern (Modèle) de la zone de profiling de données affiche une représentation graphique du type et du nombre de caractères qui constituent vos données.

Pourquoi et quand exécuter cette tâche

Cet exemple utilise un jeu de données contenant des informations clients habituelles, comme leur nom, leur adresse e-mail, l'entreprise pour laquelle ils travaillent ou leur date de souscription.

Jeu de données contenant des informations client·es.

Procédure

  1. Sélectionnez une colonne contenant les données à filtrer, Email par exemple.
  2. Dans la zone de profiling, cliquez sur l'onglet Pattern.
    Les différents modèles utilisés dans cette colonne sont affichés sous forme de diagramme. Cette colonne utilise des données de type text, le diagramme affiche donc la répartition des données à l'aide de modèles basés sur les mots.
    Modèles par mots affichés sous forme de diagramme.
  3. Passez à la vue des modèles se basant sur les caractères en cliquant sur l'icône A.
    Cela vous donne un point de vue différent pour analyser vos données.
    Modèles par caractères affichés sous forme de diagramme.
  4. Retournez à la vue des modèles se basant sur les mots en cliquant sur l'icône Text.
  5. Cliquez sur la barre supérieure pour appliquer un filtre sur le modèle le plus commun.

    La préparation affiche à présent uniquement les lignes au format [word]@[word].[word].

    Vous pouvez également utiliser la combinaison Ctrl + Clic ou Maj + Clic pour sélectionner plusieurs valeurs en même temps et appliquer un filtre plus complexe.

  6. En appuyant sur la touche Ctrl, cliquez sur la barre correspondant au modèle [word][number]@[word].[word] pour ajouter ce filtre au précédent.
    Les données qui s'affichent correspondent aux deux filtres.
    Filtres appliqués.
  7. Dans le panneau des fonctions, cliquez sur une fonction afin de l'exécuter sur les données filtrées, Delete these Filtered Rows (Supprimer ces lignes filtrées) par exemple.
  8. Dans la barre de filtre, cliquez sur la croix de chaque filtre ou sur l'icône représentant une poubelle afin d'annuler les filtres et afficher à nouveau le jeu de données complet.