Créer une règle de qualité de données en mode simple - Cloud

Guide d'utilisation de Talend Cloud Data Inventory

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Inventory
Content
Administration et monitoring > Gestion des connexions
Gouvernance de données
Qualité et préparation de données > Enrichissement de données
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Identification de données

Pourquoi et quand exécuter cette tâche

Dans cet exemple, vous travaillez dans une entreprise de e-commerce. Vous avez remarqué que certaines commandes n'ont pas été expédiées et vous souhaitez savoir pourquoi.

L'objectif est de créer deux règles empêchant les retards d'expédition. Pour ce faire, vous devez vérifier que le pays est correct que le Numéro d'Identification Fiscale (NIF) est renseigné.

Deux règles de qualité de données sont utilisées dans cet exemple :
  • une qui valide : si le statut de la commande est In process (En cours de traitement), si le pays est renseigné et correctement écrit, par rapport au type sémantique Country,
  • l'autre qui valide : si le·a client·e est identifié·e comme entreprise, le NIF (numéro d'identification fiscale) est renseigné.
Voici un échantillon du jeu de données :

Procédure

  1. Connectez-vous en tant que gestionnaire de règles.
  2. Dans le panneau de gauche, cliquez sur Data quality rules (Règles de qualité de données) > Add rule (Ajouter une règle).
  3. Saisissez le nom : Country value check.
    Les caractères supportés sont [a-z], [A-Z], [0-9] et les caractères spéciaux : _ $ # @.
  4. Saisissez une description.
    La description est facultative. Ele vous permet de trouver une règle lorsque les noms de règles sont similaires.
  5. Dans la partie If, cliquez sur Add a row (Ajouter une ligne) :
    1. Sélectionnez Variable et saisissez le nom order_status.
      Les caractères supportés sont [a-z], [A-Z], [0-9] et les caractères spéciaux : _ $ # @.
    Remarque : Les règles de qualité de données sont des modèles. Vous allez associer les variables aux champs lors de l'application de la règle à un jeu de données.
    1. Sélectionnez l'opérateur is.
      Pour plus d'informations concernant les opérateurs, consultez la liste et les exemples.
    2. Sélectionnez Value (Valeur) et saisissez In Process (En cours de traitement).
  6. Dans la partie Then, ajoutez deux lignes :
    1. Sélectionnez l'opérateur logique And (Et).
    2. Pour la première ligne, sélectionnez Variable et saisissez country.
    3. Sélectionnez l'opérateur is not empty.
    4. Pour la seconde ligne, sélectionnez Variable et saisissez country.
    5. Sélectionnez l'opérateur is of type et sélectionnez le type sémantique Country.
      La règle est définie comme suit :
  7. Cliquez sur Save.
    La première règle est créée.
  8. En suivant les étapes précédentes, créez la seconde règle nommée Customer Tax ID check.
    Les caractères supportés sont [a-z], [A-Z], [0-9] et les caractères spéciaux : _ $ # @.
    La règle est définie comme suit :
  9. Cliquez sur Save.
    La seconde règle est créée.

Que faire ensuite

Vous pouvez à présent appliquer les règles aux champs.