Utilisation d'expressions régulières pour rapprocher le contenu - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Les expressions régulières peuvent être utilisées afin de rechercher un modèle spécifique parmi vos données et isoler des valeurs qui vous intéressent.

Ce scénario prend l'exemple d'une personne travaillant sur un jeu de données listant des informations au sujet de livres, y compris leur numéro ISBN. Avec Talend Data Preparation, il est possible de vérifier si les numéros ISBN sont valides et suivent le bon modèle. Avec la fonction Matches pattern (Correspond au modèle), vous pouvez comparer vos données à une expression de votre choix.

Procédure

  1. Cliquez sur la colonne ISBN pour sélectionner son contenu.
  2. Dans la liste des fonctions, trouvez et sélectionnez Matches Pattern... (Correspond au modèle).

    Un menu s'ouvre, dans lequel vous pouvez saisir le modèle pour votre recherche.

  3. Dans la liste Pattern, sélectionnez Other (Autre).
  4. Cliquez sur le bouton à gauche du champ Manual pattern (Modèle manuel) et sélectionnez RegEx dans la liste.
  5. Dans le champ Manual pattern (Modèle manuel), saisissez ^[ISBN]\{4\}[ ]{0,1}[0-9]\{1\}[-]\{1\}[0-9]\{3\}[-]\{1\}[0-9]\{5\}[-]\{1\}[0-9]{0,1}$.

    Cette expression régulière correspond au modèle des numéros ISBN que vous souhaitez identifier dans votre modèle de données.

  6. Cliquez sur Submit.

    Une nouvelle colonne ISBN_MATCHING est créée, dans laquelle les valeurs correspondant au modèle défini par l'expression régulière, sont listées avec une valeur true. Les valeurs ne correspondant pas sont listées avec une valeur false.

Résultats

Après avoir utilisé une expression régulière pour rechercher un modèle spécifique, vous pouvez aisément identifier et isoler les valeurs correspondant à votre recherche.