Tester un ensemble de règles - 7.0

Guide utilisateur de Talend Big Data Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Cette section est un exemple et vous montre comment tester un ensemble d'analyseurs syntaxiques.

Dans cet exemple, les règles à tester sont les suivantes :

Name

Type

Valeur

"SKU"

Format

"(DIGIT DIGIT|LETTER LETTER) '-'? DIGIT DIGIT DIGIT DIGIT (DIGIT DIGIT?)? "

"LengthUnit"

"Enumeration"

" 'm' | '\'' | 'inch' | 'inches' | '\"'"

"by"

"Enumeration"

"'X' | 'x' | 'by' "

"length"

Format

"(INT | FRACTION | DECIMAL) LengthUnit "

"Size"

"Combination"

"length by length"

"WeightUnit"

"Enumeration"

" 'lb' | 'lbs' | 'pounds' | 'Kg' | 'pinds'"

"weight"

Format

"(INT | FRACTION | DECIMAL) WeightUnit "

Prérequis : Pour plus d'informations, consultez Créer un ensemble d'analyseurs syntaxiques et Accéder à la vue de test.

Remarque :

Si vous devez importer des règles d'exemple, vous pouvez le faire depuis le composant tStandardizeRow dans un Job existant, tel que le Job products_parsing dans le répertoire standardization_examples > product fourni dans le projet Data Quality Demos dans le studio. Pour plus d'informations, consultez la documentation du tStandardizeRow dans le Guide de référence des Composants Talend.

Pour reproduire ce scénario, procédez comme suit :

Procédure

  1. Dans la zone listant les règles, dans le coin supérieur gauche de la vue de test Interpreter, cliquez sur l'élément rule. ce qui signifie que vous devez tester l'ensemble complet de règles.
  2. Dans la zone des données d'exemple située dans la partie supérieure de la vue de test, saisissez des données d'exemple.
    Dans cet exemple, saisissez 34-9923, Monolithic Membrane 6125; four by eight sheet, 26 lbs 26 lbs. Ces données décrivent une marchandise.
  3. Cliquez sur le bouton de sauvegarde dans le coin supérieur droit de la zone d'exemple avant de sauvegarder ce test et saisissez un nom dans la fenêtre pop-up [Save test case], par exemple, SKU.
  4. Cliquez sur OK.
    Ce test apparaît dans la liste des tests dans le coin inférieur gauche. La vue Interpreter doit ressembler à ceci :
  5. Cliquez sur le bouton dans le coin supérieur droit pour exécuter ce test. Une fois exécuté, les résultats du test s'affiche dans la partie inférieure de cette vue.
    Dans ces résultats, vous pouvez facilement visualiser où améliorer les règles données. Les données four by eight sheet représentent une taille mais ne sont pas mises en correspondance avec la règle correspondante. Vous pouvez ajouter de nouvelles règles ou modifier les règles existantes. Les deux manières de procéder sont contextuelles et l'une n'est pas nécessairement meilleure que l'autre. Dans cet exemple, ajoutez une règle Enumeration et modifiez les règles Length et LengthUnit afin d'améliorer l'exactitude des correspondances.

    Name

    Type

    Value

    "length"

    Format

    "(INT | FRACTION | DECIMAL ) LengthUnit | Number LengthUnit?"

    Number

    "Enumeration"

    "'four' | 'eight' "

    "LengthUnit"

    "Enumeration"

    " 'm' | '\'' | 'inch' | 'sheet' | 'inches' | '\"' "

    La nouvelle règle Length signifie que four et eight, avec ou sans unité de longueur (length) peuvent être mises en correspondance :
    Remarque :

    Pour mettre à jour ces règles, vous devez connaître la grammaire ANTLR et les éléments ANTLR utilisés pour écrire une règle. Pour plus d'informations, consultez le Guide de référence des Talend Components. Pour des informations plus détaillées, consultez le site Web d'ANTLR.

  6. Cliquez sur le bouton de sauvegarde sous la table de règles afin de rafraîchir la vue de test et regénérer le code de l'analyseur. Les zones de données d'exemple et de test sont vidées.
  7. Dans la liste des tests, dans le coin inférieur gauche, sélectionnez l'exemple de données SKU précédemment sauvegardé.
  8. Cliquez sur le bouton dans le coin supérieur droit pour exécuter ce test. Une fois exécuté, les résultats du nouveau test s'affichent dans la zone correspondante :
    Dans ces résultats, vous pouvez voir que les données four by eight sheet ont été mises en correspondance avec la règle Size de type Combination.
    Remarque :
    La vue de test n'affiche pas le nom des règles de type Combination, puisque ce type permet la répétition des noms des règles. Ainsi, dans la vue Grammar ANTLR, les noms des règles de type Combination, pas toujours uniques, ne sont pas générés dans le code, afin d'éviter les erreurs de doublons. La capture d'écran suivante montre le code correspondant à cet exemple : le nom Size est toujours une valeur littérale entre guillemets, sans l'élément code équivalent, alors que les règles de format SKU et length ont leur éléments de code correspondant, sku et length. Pour plus d'informations concernant la grammaire ANTLR, consultez le site Web d'ANTLR.
    Vous pouvez utiliser d'autres exemples de données afin de continuer à améliorer ces règles. Cette vue de test vous permet de composer les règles répondant le mieux à vos besoins.