Changer le type sémantique d'une colonne - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données

Lorsque vous ajoutez un jeu de données, l'application suggère automatiquement l'un des types sémantiques supportés pour chaque colonne.

Le type sémantique correspond à la catégorie (noms, e-mails, numéros de téléphone, etc) des données. Si le type sémantique appliqué sur une colonne n'est pas celui souhaité, vous avez la possibilité de le changer manuellement en l'un des types prédéfinis (predefined types), en fonction de votre propre expérience.

Prenons par exemple un jeu de données contenant des données clients, y compris la profession de vos clients. Vous pouvez voir dans l'en-tête de la colonne job que le type de données a été reconnu comme String. Vous allez modifier le type sémantique de la colonne pour qu'il reflète mieux les données.

Remarque : Vous pouvez également modifier des types sémantiques depuis le panneau Data model de la vue hiérarchique d'un jeu de données.

Procédure

  1. Cliquez sur l'icône de menu dans l'en-tête de la colonne job.
  2. Depuis le menu qui s'ouvre, vous pouvez :
    • Commencer à saisir le nom du type que vous pensez approprié dans le champ Find another semantic type.

      Lors de la saisie, une fonctionnalité d'auto-complétion suggère une liste de types disponibles pour vos données.

    • Sélectionner l'une des suggestions, en fonction du pourcentage de correspondance avec votre colonne.
    Remarque : Pour modifier le type sémantique dans une colonne de préparation, cliquez sur l'icône de menu dans la colonne d'en-tête et cliquez sur This column is of type pour ouvrir le menu des types sémantiques.
  3. Dans ce cas, cliquez sur le type Job Title dans les suggestions.
    Selon les statistiques, ce type sémantique correspond le plus aux valeurs contenues dans la colonne.

Résultats

Le type de colonne est directement modifié en Job Title, comme vous pouvez le voir dans l'en-tête de la colonne job.

Chaque fois que le type sémantique d'une colonne est modifiée, la qualité du jeu de données est recalculée.