Supprimer les valeurs ne correspondant pas - 6.5

Exemples de Jobs et d'analyse de qualité de données

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Open Studio for Data Quality
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Qualité et préparation de données
EnrichPlatform
Studio Talend
Le modèle des e-mails utilisé sur la colonne email montre que certains enregistrements ne respectent pas le format standard des e-mails. Générez un Job prêt à l'emploi afin de récupérer les lignes ne correspondant pas, de la colonne.

Procédure

  1. Dans la perspective Profiling , cliquez sur l'onglet Analysis Results au bas de l'éditeur.
  2. Dans les résultats Pattern Matching de la colonne email, cliquez-droit sur le diagramme en barres ou sur les résultats numériques et sélectionnez Generate Job.
  3. Dans la boîte de dialogue, sélectionnez Generate an ETL Job to handle rows.

    La perspective Integration s'ouvre sur le Job généré.

    Ce Job utilise le processus ETL (extraction, transformation et chargement) pour écrire les lignes d'e-mails valides/invalides correspondant/ne correspondant pas au modèle, dans deux fichiers de sortie séparés.

  4. Sauvegardez le Job et appuyez sur F6 pour l'exécuter.

Résultats

Les lignes valides et invalides de la colonne email sont écrites dans les fichiers de sortie définis.

Vous pouvez remplacer les fichiers de sortie par différents composants Talend et récupérer les lignes d'e-mails valides/invalides et les écrire dans des bases de données, par exemple.

Que faire ensuite

Vous pouvez suivre la même procédure pour récupérer les lignes invalides de la colonne postal.

Pour plus d'informations concernant l'utilisation de la perspective Profiling pour identifier et supprimer les données corrompues, incomplètes ou imprécises, consultez le chapitre Nettoyage de données, dans le Guide utilisateur du Studio Talend.