Accéder au contenu principal Passer au contenu complémentaire

Utilisation d'expressions régulières pour rapprocher le contenu

Les expressions régulières peuvent être utilisées afin de rechercher un modèle spécifique parmi vos données et isoler des valeurs qui vous intéressent.

Ce scénario prend l'exemple d'une personne travaillant sur un jeu de données listant des informations au sujet de livres, y compris leur numéro ISBN. Avec Talend Data Preparation, il est possible de vérifier si les numéros ISBN sont valides et suivent le bon modèle. Avec la fonction Matches pattern (Correspond au modèle), vous pouvez comparer vos données à une expression de votre choix.

Procédure

  1. Cliquez sur la colonne ISBN pour sélectionner son contenu.
  2. Dans la liste des fonctions, trouvez et sélectionnez Matches Pattern... (Correspond au modèle).

    Un menu s'ouvre, dans lequel vous pouvez saisir le modèle pour votre recherche.

  3. Dans la liste Pattern, sélectionnez Other (Autre).
  4. Cliquez sur le bouton à gauche du champ Manual pattern (Modèle manuel) et sélectionnez RegEx dans la liste.
  5. Dans le champ Manual pattern (Modèle manuel), saisissez ^[ISBN]\{4\}[ ]{0,1}[0-9]\{1\}[-]\{1\}[0-9]\{3\}[-]\{1\}[0-9]\{5\}[-]\{1\}[0-9]{0,1}$.

    Cette expression régulière correspond au modèle des numéros ISBN que vous souhaitez identifier dans votre modèle de données.

  6. Cliquez sur Submit.

    Une nouvelle colonne ISBN_MATCHING est créée, dans laquelle les valeurs correspondant au modèle défini par l'expression régulière, sont listées avec une valeur true. Les valeurs ne correspondant pas sont listées avec une valeur false.

Résultats

Après avoir utilisé une expression régulière pour rechercher un modèle spécifique, vous pouvez aisément identifier et isoler les valeurs correspondant à votre recherche.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !