Modification des indicateurs de modèles et utilisation de ces indicateurs dans une analyse de colonnes - 7.0

Guide d'utilisation de Talend Open Studio for Data Quality

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Open Studio for Data Quality
task
Création et développement
EnrichPlatform
Studio Talend
Avant de pouvoir utiliser des expressions régulières dans des colonnes analysées d'une base de données, vous devez d'abord déclarer la fonction de l'expression régulière créée en ajoutant l'instruction SQL et le modèle.

Procédure

  1. Dans la perspective Profiling, développez Libraries > Indicators > System Indicators.
  2. Dans le dossier Pattern Matching, double-cliquez sur Regular Expression Matching.
  3. Dans la vue Indicator Definition, cliquez sur [+].
  4. Dans la nouvelle ligne d'indicateur, sélectionnez Teradata dans la liste Database.
  5. Cliquez sur Edit... à côté du nouveau champ pour ouvrir la boîte de dialogue Edit expression.
  6. Dans la zone Expression, ajoutez l'expression SQL suivante :
    SELECT COUNT(CASE WHEN Regex_INSTR(<%=__COLUMN_NAMES__%>,<%=__PATTERN_EXPR__%>) =1 THEN 1 END), COUNT(*)FROM <%=__TABLE_NAME__%> <%=__WHERE_CLAUSE__%>
  7. Ajoutez l'indicateur de modèles modifié dans une analyse de colonnes.
  8. Exécutez l'analyse et passez à la page Analysis Results.
  9. Dans la table Pattern Matching, cliquez-droit sur les résultats des modèles et sélectionnez View invalid rows, par exemple. L'éditeur SQL editor s'ouvre et affiche une liste de données invalides. L'expression SQL s'affiche comme suit :
    SELECT * FROM "test"."Employee" WHERE ( not REGEX_INSTR("FULLNAME" , '^[A-Z]+' ) =1 OR "FULLNAME" IS NULL )