Utilisation d'expressions régulières pour rapprocher le contenu

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend MDM Platform
Talend Real-Time Big Data Platform
Talend Data Services Platform
Talend Big Data
Talend Data Management Platform
Talend Data Fabric
Talend ESB
Talend Data Integration
Talend Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Les expressions régulières peuvent être utilisées afin de rechercher un modèle spécifique parmi vos données et isoler des valeurs qui vous intéressent.

Ce scénario prend l'exemple d'une personne travaillant sur un jeu de données listant des informations au sujet de livres, y compris leur numéro ISBN. Avec Talend Data Preparation, il est possible de vérifier si les numéros ISBN sont valides et suivent le bon modèle. Avec la fonction Matches pattern, vous pouvez comparer vos données à une expression de votre choix.

Procédure

  1. Cliquez sur la colonne ISBN pour sélectionner son contenu.
  2. Dans la liste des fonctions, trouvez et sélectionnez Matches Pattern....

    Un menu s'ouvre, dans lequel vous pouvez saisir le modèle pour votre recherche.

  3. Dans la liste Pattern, sélectionnez custom.
  4. Cliquez sur le bouton à gauche du champ Manual pattern et sélectionnez RegEx dans la liste.
  5. Dans le champ Manual pattern, saisissez ^[ISBN]{4}[ ]{0,1}[0-9]{1}[-]{1}[0-9]{3}[-]{1}[0-9]{5}[-]{1}[0-9]{0,1}$.
    Cette expression régulière correspond au modèle des numéros ISBN que vous souhaitez identifier dans votre modèle de données.
  6. Cliquez sur Submit.
    Une nouvelle colonne ISBN_MATCHING est créée, dans laquelle les valeurs correspondant au modèle défini par l'expression régulière, sont listées avec une valeur true. Les valeurs ne correspondant pas sont listées avec une valeur false.

Résultats

Après avoir utilisé une expression régulière pour rechercher un modèle spécifique, vous pouvez aisément identifier et isoler les valeurs correspondant à votre recherche.