Supprimer les valeurs ne correspondant pas - 7.3

Guide de prise en main de Talend Data Fabric

Version
7.3
Language
Français
Operating system
Data Fabric
Product
Talend Data Fabric
Module
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Content
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
Last publication date
2023-07-24

Les résultats des modèles utilisés dans les colonnes Email et Phone montrent que certains enregistrements ne respectent pas les formats standard d'e-mail et de numéro de téléphone. Pour plus d'informations, consultez Afficher les résultats d'analyse.

À partir des résultats d'analyse, vous pouvez générer des Jobs prêts à l'emploi pour récupérer les lignes ne correspondant pas, dans les colonnes.

Vous pouvez suivre la même procédure pour la suppression des valeurs ne correspondant pas dans les colonnes Email ou Phone.

Avant de commencer

Procédure

  1. Ouvrez l'analyse de colonnes dans la perspective Profiling et cliquez sur Analysis Results au bas de l'éditeur.
  2. Dans les tables Pattern Matching des colonnes Email ou Phone, cliquez-droit sur les résultats et sélectionnez Generate Job.

    Cet exemple utilise les résultats du modèle US Phone numbers utilisé dans la colonne Phone.

  3. Dans l'assistant qui s'affiche, cliquez sur Finish pour confirmer la création du Job.

    La perspective Integration s'ouvre sur le Job généré. Ce dernier est listé dans l'arborescence Repository.

    Ce Job utilise le processus ETL (extraction, transformation et chargement) pour écrire les lignes des numéros de téléphone correspondant et ne correspondant pas au modèle, dans deux fichiers de sortie séparés.

    Le tMysqlInput est automatiquement configuré selon votre connexion et le tPatternCheck selon la colonne analysée.

  4. Double-cliquez sur chaque composant de sortie et modifiez le nom ou le chemin d'accès par défaut des fichiers de sortie, si nécessaire.
  5. Appuyez sur F6 pour exécuter le Job.

    Les numéros de téléphone correspondant et ne correspondant pas sont écrits dans deux fichiers de sortie séparés.

  6. Cliquez-droit sur chaque composant tFileOutputDelimited et sélectionnez Data Viewer pour ouvrir une vue sur les données qui correspondent et sur celles qui ne correspondent pas au modèle de numéros de téléphone.

Résultats

Vous pouvez ensuite créer un Job, par exemple pour standardiser les numéros de téléphone correspondants au modèle et les mettre au format international requis à l'aide du composant tStandardizePhoneNumber.