Changer le type sémantique d'une colonne - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-02-21

Lorsque vous ajoutez un jeu de données, l'application suggère automatiquement l'un des types sémantiques supportés pour chaque colonne.

Le type sémantique correspond à la catégorie (noms, e-mails, numéros de téléphone, etc) des données. Si le type sémantique appliqué sur une colonne n'est pas celui souhaité, vous avez la possibilité de le changer manuellement en l'un des types prédéfinis (predefined types), en fonction de votre propre expérience.

Prenons par exemple un jeu de données contenant des données clients, y compris la profession de vos clients. Vous pouvez voir dans l'en-tête de la colonne job que le type de données a été reconnu comme Text (string). Vous allez modifier le type sémantique de la colonne pour qu'il reflète mieux les données.

Une colonne nommée 'job' avec un type sémantique Text.
Remarque : Vous pouvez également modifier des types sémantiques depuis le panneau Data model de la vue hiérarchique d'un jeu de données.

Procédure

  1. Cliquez sur l'en-tête de la colonne job.
  2. Dans la section Type du panneau de droite, cliquez sur l'icône représentant un crayon, près du type sémantique courant.
  3. Pour modifier le type, vous pouvez :
    • Commencer à saisir le nom du type que vous pensez approprié dans le champ Find a semantic type (Trouver un type sémantique).

      Lors de la saisie, une fonctionnalité d'auto-complétion suggère une liste de types disponibles pour vos données.

    • Sélectionner l'une des suggestions, en fonction du pourcentage de correspondance avec votre colonne.
    La fenêtre 'Edit type (Modifier le type)' avec un champ de recherche et des suggestions de types sémantiques.
    Remarque : Pour modifier le type sémantique dans une colonne de préparation, cliquez sur l'icône de menu dans l'en-tête de colonne et cliquez sur This column is of type (Cette colonne est de type) pour ouvrir le menu des types sémantiques.
  4. Dans ce cas, cliquez sur le type Job Title dans les suggestions.
    Selon les statistiques, ce type sémantique correspond le plus aux valeurs contenues dans la colonne.
  5. Cliquez sur Apply 1 change (Appliquer 1 modification).

Résultats

Le type de colonne est modifié en Job Title, comme vous pouvez le voir dans l'en-tête de la colonne job.

Chaque fois que le type sémantique d'une colonne est modifiée, la qualité du jeu de données est recalculée.