Configurer des modèles - 7.2

Guide de prise en main de Talend Real-Time Big Data Platform

Version
7.2
Language
Français (France)
Product
Talend Real-Time Big Data Platform
Module
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Content
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
Cette analyse de colonnes utilise des modèles prédéfinis pour que le contenu des colonnes Email et Phone corresponde aux modèles standard d'e-mails et de numéros de téléphone basés aux États-Unis, respectivement. Cette analyse définit le contenu, la structure et la qualité des adresses e-mail et des numéros de téléphone, et donne un pourcentage des données qui correspondent aux formats standard ainsi que des données qui ne correspondent pas.

Avant de commencer

  • Vous avez ouvert la perspective Profiling dans le Studio.

  • Vous avez créé une analyse de colonnes et défini la connexion à la base de données.

Procédure

  1. Dans la section Data Preview de l'éditeur d'analyse, cliquez sur l'icône à côté de la colonne Email pour ouvrir la boîte de dialogue Pattern Selector.
  2. Développez Regex > internet, cochez la case Email Address et cliquez sur OK pour fermer la boîte de dialogue.

    Le modèle est ajouté à la colonne dans la zone Analyzed Columns.

  3. Cliquez sur l'icône à côté de la colonne Phone pour ouvrir la boîte de dialogue Pattern Selector.
  4. Développez Regex > phone, cochez la case US phone numbers et cliquez sur OK pour fermer la boîte de dialogue.

    Le modèle est ajouté à la colonne dans la zone Analyzed Columns.

  5. Cliquez sur l'icône à côté des modèles Email Address et US phone numbers, et dans les champs Lower threshold (%), saisissez 98.0.

    Si le nombre d'enregistrements correspondants aux modèles est inférieur à 98 %, il est indiqué en rouge dans les résultats d'analyse.