Configurer les modèles - 6.5

Exemples de Jobs et d'analyse de qualité de données

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous allez mettre en correspondance le contenu de la colonne email par rapport au format d'e-mail standard et le contenu de la colonne postal par rapport au format standard des code postaux des États-Unis.

Cela permet de définir le contenu, la structure et la qualité des adresses e-mail et des codes postaux, ainsi que donner un pourcentage des données correspondant aux formats standards et des données ne correspondant pas.

Procédure

  1. Dans la vue Analyzed Columns, cliquez sur l'icône à côté de la colonne email.
  2. Dans la boîte de dialogue Pattern Selector, développez Regex et parcourez l'arborescence jusqu'au nœud Email Address, dans le dossier internet, puis cliquez sur OK.
  3. Cliquez sur l'icône d'option à côté de l'indicateur Email Address et saisissez 98.0 dans le champ Lower threshold (%).
    Si le nombre d'enregistrements correspondant au modèle est inférieur à 98 %, ils seront marqués en rouge dans les résultats de l'analyse.
  4. Répétez l'opération pour ajouter la colonne postal au modèle US Zipcode Validation depuis le dossier address.

    Pour plus d'informations concernant les types de modèles et leur utilisation lors d'analyses de données, consultez le Guide utilisateur du Studio Talend.