Configurer les modèles - 7.3

Exemples de Jobs et d'analyses de qualité de données

Version
7.3
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Qualité et préparation de données
Last publication date
2023-03-02

Vous allez mettre en correspondance le contenu de la colonne email par rapport au format d'e-mail standard et le contenu de la colonne postal par rapport au format standard des codes postaux des États-Unis.

Cela permet de définir le contenu, la structure et la qualité des adresses e-mail et des codes postaux, ainsi que donner un pourcentage des données correspondant aux formats standards et des données ne correspondant pas.

Procédure

  1. Dans la vue Analyzed Columns, cliquez sur l'icône près de l'e-mail pour ouvrir la boîte de dialogue Pattern Selector.
  2. Développez Regex > internet, cochez la case Email Address et cliquez sur OK pour fermer la boîte de dialogue.
  3. Cliquez sur l'icône à côté de l'indicateur Email Address et saisissez 98.0 dans le champ Lower threshold (%).

    Si le nombre d'enregistrements correspondants aux modèles est inférieur à 98%, il est indiqué en rouge dans les résultats d'analyse.

  4. Répétez l'opération pour ajouter la colonne postal au modèle US Zipcode Validation depuis le dossier address.

    Pour plus d'informations concernant les types de modèles et leur utilisation lors d'analyses de données, consultez Modèles dans le Guide d'utilisation duStudio Talend.