Créer les règles d'analyse - 7.1

Standardization

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le composant tStandardizeRow pour afficher sa vue Basic settings.
  2. Dans la liste Column to parse, sélectionnez product.
  3. Dans la table Conversion rules, définissez une règle simple et une règle avancée, comme suit :
    • Cliquez deux fois sur le bouton [+] pour ajouter deux colonnes. Nommez la première "Amount" et la seconde "LiquidAmount".

    • Sélectionnez Format comme type de règle simple et saisissez "INT WHITESPACE* WORD".

    • Sélectionnez RegExp comme type pour la règle avancée et saisissez "\\d+\\s*(L|ML)\\b".

      La règle avancée est exécutée après la règle simple ANTLR. La règle "Amount" divise en jetons les quantités des trois chaînes de caractères, met en correspondance un mot et une valeur numérique. La règle RegExp vérifie chaque jeton créé par ANTLR par rapport à une expression régulière.

  4. Cliquez sur le bouton Generate parser code in Routines afin de générer le code sous le dossier Routines dans la vue DQ Repository de la perspective Profiling .
    Cette étape est obligatoire, sinon le Job ne s'exécute pas.
  5. Dans la vue Advanced settings, laissez les options par défaut dans la zone Output format.
    Le paramètre Max edits for fuzzy match est configuré à 1 par défaut.
  6. Double-cliquez sur le tLogRow et sélectionnez l'option Table (print values in cells of a table) dans la zone Mode.