Accéder au contenu principal Passer au contenu complémentaire

Utilisation d'expressions régulières pour rapprocher le contenu

Les expressions régulières peuvent être utilisées afin de rechercher un modèle spécifique parmi vos données et isoler des valeurs qui vous intéressent.

Ce scénario prend l'exemple d'une personne travaillant sur un jeu de données listant des informations au sujet de livres, y compris leur numéro ISBN. Avec Talend Data Preparation, il est possible de vérifier si les numéros ISBN sont valides et suivent le bon modèle. Avec la fonction Match pattern (Correspondre au modèle), vous pouvez comparer vos données à une expression de votre choix.

Procédure

  1. Cliquez sur la colonne ISBN pour sélectionner son contenu.
    Illustration de la colonne ISBN.
  2. Dans la liste des fonctions, trouvez et sélectionnez Match Pattern... (Correspondre au modèle...).

    Un menu s'ouvre, dans lequel vous pouvez saisir le modèle pour votre recherche.

  3. Dans la liste Pattern, sélectionnez Other (Autre).
  4. Cliquez sur le bouton à gauche du champ Manual pattern (Modèle manuel) et sélectionnez Regex dans la liste.
    Option Regex sélectionnée dans le champ Manual pattern (Modèle manuel).
  5. Dans le champ Manual pattern (Modèle manuel), saisissez ^[ISBN]\{4\}[ ]{0,1}[0-9]\{1\}[-]\{1\}[0-9]\{3\}[-]\{1\}[0-9]\{5\}[-]\{1\}[0-9]{0,1}$.

    Cette expression régulière correspond au modèle des numéros ISBN que vous souhaitez identifier dans votre modèle de données.

  6. Cliquez sur Submit.

    Une nouvelle colonne ISBN_matching est créée, dans laquelle les valeurs correspondant au modèle défini par l'expression régulière, sont listées avec une valeur true. Les valeurs ne correspondant pas sont listées avec une valeur false.

    Illustration des colonnes ISBN et ISBN_matching.

Résultats

Après avoir utilisé une expression régulière pour rechercher un modèle spécifique, vous pouvez aisément identifier et isoler les valeurs correspondant à votre recherche.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !