Tester un ensemble de règles - 7.1

Guide utilisateur de Talend Data Fabric Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Data Fabric
task
Création et développement
EnrichPlatform
Studio Talend
Cette section est un exemple et vous montre comment tester un ensemble d'analyseurs syntaxiques.

Avant de commencer

Prérequis : Vous devez savoir comment créer un ensemble d'analyseurs syntaxiques et comment accéder à la vue de test correspondant dans la fenêtre principale de votre Studio Talend. Pour plus d'informations, consultez Créer des analyseurs syntaxiques et Accéder à la vue de test.

Remarque : Si vous devez importer des règles d'exemple, vous pouvez le faire depuis le composant tStandardizeRow dans un Job existant, tel que le Job products_parsing dans le répertoire standardization_examples > product fourni dans le projet Data Quality Demos dans le Studio Talend. Pour plus d'informations, consultez la documentation du tMatchGroup dans le Guide de référence des Composants Talend.

Pourquoi et quand exécuter cette tâche

Dans cet exemple, les règles à tester sont les suivantes :

Name

Type

Valeur

"SKU" "Format" "(DIGIT DIGIT|LETTER LETTER) '-'? DIGIT DIGIT DIGIT DIGIT (DIGIT DIGIT?)? "
"LengthUnit" "Enumeration" " 'm' | '\'' | 'inch' | 'inches' | '\"'"
"by" "Enumeration" "'X' | 'x' | 'by' "
"length" "Format" "(INT | FRACTION | DECIMAL) LengthUnit "
"Size" "Combination" "length by length"
"WeightUnit" "Enumeration" " 'lb' | 'lbs' | 'pounds' | 'Kg' | 'pinds'"
"weight" "Format" "(INT | FRACTION | DECIMAL) WeightUnit "

Procédure

  1. Dans la zone listant les règles, dans le coin supérieur gauche de la vue de test Interpreter, cliquez sur l'élément rule. ce qui signifie que vous devez tester l'ensemble complet de règles.
  2. Dans la zone des données d'exemple située dans la partie supérieure de la vue de test, saisissez des données d'exemple.
    Dans cet exemple, saisissez 34-9923, Monolithic Membrane 6125; four by eight sheet, 26 lbs 26 lbs. Ces données décrivent une marchandise.
  3. Cliquez sur le bouton de sauvegarde dans le coin supérieur droit de la zone d'exemple avant de sauvegarder ce test et saisissez un nom dans la fenêtre pop-up [Save test case], par exemple, SKU.
  4. Cliquez sur OK.
    Ce test apparaît dans la liste des tests dans le coin inférieur gauche. La vue Interpreter doit ressembler à ceci :
  5. Cliquez sur le bouton dans le coin supérieur droit pour exécuter ce test. Une fois exécuté, les résultats du test s'affiche dans la partie inférieure de cette vue.
    Dans ces résultats, vous pouvez facilement visualiser où améliorer les règles données. Les données four by eight sheet représentent une taille mais ne sont pas mises en correspondance avec la règle correspondante. Vous pouvez ajouter de nouvelles règles ou modifier les règles existantes. Les deux manières de procéder sont contextuelles et l'une n'est pas nécessairement meilleure que l'autre. Dans cet exemple, ajoutez une règle Enumeration et modifiez les règles Length et LengthUnit afin d'améliorer l'exactitude des correspondances.
    Name Type Valeur
    "length" "Format" "(INT | FRACTION | DECIMAL ) LengthUnit | Number LengthUnit?"
    "Number" "Enumeration" "'four' | 'eight' "
    "LengthUnit" "Enumeration" " 'm' | '\'' | 'inch' | 'sheet' | 'inches' | '\"' "
    La nouvelle règle Length signifie que four et eight, avec ou sans unité de longueur (length) peuvent être mises en correspondance :
    Remarque : Pour mettre à jour ces règles, vous devez connaître la grammaire ANTLR et les éléments ANTLR utilisés pour écrire une règle. Pour plus d'informations, consultez le Guide de référence des Composants Talend. Pour des informations plus détaillées, consultez le site Web d'ANTLR.
  6. Cliquez sur le bouton de sauvegarde sous la table de règles afin de rafraîchir la vue de test et regénérer le code de l'analyseur. Les zones de données d'exemple et de test sont vidées.
  7. Dans la liste des tests, dans le coin inférieur gauche, sélectionnez l'exemple de données SKU précédemment sauvegardé.
  8. Cliquez sur le bouton dans le coin supérieur droit pour exécuter ce test. Une fois exécuté, les résultats du nouveau test s'affichent dans la zone correspondante :
    Dans ces résultats, vous pouvez voir que les données four by eight sheet ont été mises en correspondance avec la règle Size de type Combination.
    Remarque :

    La vue de test n'affiche pas le nom des règles de type Combination, puisque ce type permet la répétition des noms des règles. Ainsi, dans la vue Grammar ANTLR, les noms des règles de type Combination, pas toujours uniques, ne sont pas générés dans le code, afin d'éviter les erreurs de doublons. La capture d'écran suivante montre le code correspondant à cet exemple : le nom Size est toujours une valeur littérale entre guillemets, sans l'élément code équivalent, alors que les règles de format SKU et length ont leur éléments de code correspondant, sku et length. Pour plus d'informations concernant la grammaire ANTLR, consultez le site Web d'ANTLR.

    Vous pouvez utiliser d'autres exemples de données afin de continuer à améliorer ces règles. Cette vue de test vous permet de composer les règles répondant le mieux à vos besoins.