Créer une nouvelle expression régulière ou un nouveau modèle SQL - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Vous pouvez créer de nouvelles expressions régulières ou de nouveaux modèles SQL, y compris celles et ceux pour Java à utiliser lors d'analyses de colonnes.

Remarque : Les processus de gestion des expressions régulières et des modèles SQL sont les mêmes. La procédure ci-dessous avec toutes ses captures d'écran reflète les étapes de la création d'une expression régulière, mais vous pouvez suivre les mêmes étapes pour créer un modèle SQL. mais vous pouvez suivre les mêmes étapes pour créer un modèle SQL.

Prérequis : La perspective Profiling du studio doit être sélectionnée.

Pour créer un nouveau modèle, procédez comme suit :

Procédure

  1. Dans la vue DQ Repository, développez successivement les nœuds Libraries > Patterns puis cliquez-droit sur Regex.
  2. Dans le menu contextuel, sélectionnez New Regex Pattern pour ouvrir l'assistant correspondant.
    Lorsque vous ouvrez l'assistant, un panneau d'aide s'ouvre automatiquement à côté de l'assistant. Ce panneau d'aide vous guide à travers les étapes de la création de nouveaux modèles.
  3. Dans le champ Name, saisissez un nom pour cette nouvelle expression régulière.
    Remarque :

    Il est recommandé de ne pas utiliser les caractères spéciaux suivants dans le nom de l'élément, notamment :

    "~", "!", "`", "#", "^", "&", "*", "\\", "/", "?", ":", ";", "\"", ".", "(", ")", "'", "¥", "'", """, "«", "»", "<", ">".

    Ces caractères seront remplacés par un "_" dans le système de fichiers.

  4. Définissez les autres métadonnées : Purpose, Description et Author (objectif, description et nom de l'auteur) dans les champs correspondants puis cliquez sur Next.
  5. Dans le champ Regular expression, saisissez la définition de l'expression régulière à créer. L'expression régulière doit être entourée de guillemets simples.
    Remarque :

    Pour la base de données PostgreSQL, les expressions régulières ne sont pas compatibles entre les différentes versions de la base de données.

    Si vous souhaitez utiliser des expressions régulières avec la version 9.1 de PostgreSQL ou avec une version supérieure, vous devez :
    • durant la configuration de la base de données PostgreSQL, définir le paramètre standard_conforming_strings à off et saisir une double barre oblique inversée dans la définition, ou,

    • dans le champ Regular expression de l'assistant, utiliser une seule barre oblique inversée dans la définition de l'expression.

    Pour plus d'informations concernant les expressions régulières dans PostgreSQL, cliquez sur Window > Show View, développez Help et sélectionnez Bookmarks.

  6. Dans la liste Language Selection, sélectionnez le langage adéquat.
    Avertissement : Si vous sélectionnez une base de données dans la liste Language Selection, vous pouvez générer des Jobs ELT sur les résultats d'analyse de colonnes pour récupérer des lignes valides et invalides. Si vous sélectionnez le langage Java ou Default, vous pouvez générer des Jobs ETL sur les résultats d'une analyse de colonnes. Pour plus d'informations concernant la génération d'un Job pour récupérer des lignes valides, invalides, ou récupérer les deux, consultez Récupérer les lignes valides/invalides dans une analyse de colonne(s).
  7. Cliquez sur Finish afin de fermer la boîte de dialogue.
    Un sous-dossier pour cette nouvelle expression régulière s'affiche sous le nœud Regex dans la vue DQ Repository, et l'éditeur de modèle s'ouvre avec les métadonnées définies.
  8. Dans la vue Pattern Definition, cliquez sur le bouton [+] et ajoutez autant d'expressions régulières que nécessaire dans le nouveau modèle.
    Vous pouvez définir les expressions régulières spécifiques à n’importe quelle base de données disponible ou spécifiques à Java.
    Remarque : Si l'expression régulière est assez simple pour être utilisée dans toutes les bases de données, sélectionnez Default dans la liste.
    Les sous-dossiers nommés selon les types de bases de données ou Java spécifiés s'affichent sous le nom du modèle créé, sous le dossier Patterns dans la vue DQ Repository.
  9. Sauvegardez le nouveau modèle.
    Une fois le modèle créé, vous pouvez le glisser sur une colonne dans l'éditeur d'analyse ouvert.
  10. Si nécessaire, cliquez sur le nom du modèle pour afficher ses informations dans la vue Detail View ainsi que dans la vue Technical dans le Studio.
    Remarque : Dans l'éditeur de modèle, vous pouvez cliquer sur Test à côté de l'expression régulière afin de tester la définition du modèle. Pour plus d'informations, consultez Tester une expression régulière dans la vue Pattern Test. Dans la vue [Pattern Test View], vous pouvez créer un nouveau modèle basé sur l'expression régulière que vous testez. Pour plus d'informations, consultez Créer un nouveau modèle depuis la vue Pattern Test.