Modifier des indicateurs de modèles et utiliser de ces indicateurs dans une analyse de colonnes - 8.0

Guide d'utilisation de Talend Big Data Platform Studio

Version
8.0
Language
Français (France)
EnrichDitaval
Big Data Platform
Product
Talend Big Data Platform
Module
Studio Talend
Content
Création et développement
Avant de pouvoir utiliser des expressions régulières dans des colonnes analysées d'une base de données, vous devez d'abord déclarer la fonction de l'expression régulière créée en ajoutant l'instruction SQL et le modèle.

Procédure

  1. Dans la perspective Profiling, développez Libraries > Indicators > System Indicators.
  2. Dans le dossier Pattern Matching, double-cliquez sur Regular Expression Matching.
  3. Dans la vue Indicator Definition, cliquez sur [+].
  4. Dans la ligne d'indicateur, sélectionnez Teradata dans la liste Database.
  5. Cliquez sur Edit... à côté du nouveau champ pour ouvrir la boîte de dialogue Edit expression.
  6. Dans la zone Expression, ajoutez l'expression SQL suivante :
    SELECT COUNT(CASE WHEN Regex_INSTR(<%=__COLUMN_NAMES__%>,<%=__PATTERN_EXPR__%>) =1 THEN 1 END), COUNT(*)FROM <%=__TABLE_NAME__%> <%=__WHERE_CLAUSE__%>
  7. Ajoutez l'indicateur de modèles modifié dans une analyse de colonnes.
  8. Exécutez l'analyse et passez à la page Analysis Results.
  9. Dans la table Pattern Matching, cliquez-droit sur les résultats des modèles et sélectionnez View invalid rows, par exemple. L'éditeur SQL editor s'ouvre et affiche une liste de données invalides. L'expression SQL s'affiche comme suit :
    SELECT * FROM "test"."Employee" WHERE ( not REGEX_INSTR("FULLNAME" , '^[A-Z]+' ) =1 OR "FULLNAME" IS NULL )