Formater des numéros de Sécurité Sociale à l'aide du remplissage par magie - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Vous pouvez utilisez la fonctionnalité de remplissage par magie pour formater des numéros de Sécurité Sociale, selon un modèle défini par des exemples.

Dans cette exemple, votre jeu de données contient des informations sur vos clients comme des noms, des adresses e-mail, et surtout, des numéros de Sécurité Sociale. Cependant, ces numéros de Sécurité Sociale ont été saisis au mauvais format, sans tirets. Par exemple, un numéro comme 334-20-6259, a été saisi 334206259 dans ce jeu de données. En raison du mauvais format, la plupart des données sont qualifiées par l'application de numéros de routage, et sont considérées comme invalides.

Pour résoudre cette erreur, la fonctionnalité de remplissage par magie va permettre d'appliquer le format de numéros de Sécurité Sociale correct à vos données, en suivant un modèle basé sur quelques exemples que vous avez entré.

Procédure

  1. Cliquez sur l'en-tête de la colonne ssn pour sélectionner son contenu.
  2. Dans le panneau des fonctions, saisissez Magic fill et cliquez sur le résultat pour afficher les options de la fonction associée.
  3. Dans le champ Input, saisissez une des valeurs de la colonne ssn que vous souhaitez transformer, 472989590 par exemple.
  4. Dans le champ Output, saisissez la même valeur, dans le bon format cette fois-ci : 472-98-9590.
    Pour que la fonction puisse fonctionner, vous devez saisir au moins deux exemples complets de la transformation à appliquer. Vous pouvez ajouter jusqu'à trois autres exemples. Les exemples peuvent être extraits de votre jeu de données ou inventés. Plus vous saisissez d'exemples, plus le modèle sera identifié précisement par la fonction.
  5. Saisissez plus d'exemples avant-après dans les champs restant :
    • 428990989 comme Input 2 et 428-99-0989 comme Output 2
    • 281066499 comme Input 3 et 281-06-6499 comme Output 3
    • 244356471 comme Input 4 et 244-35-6471 comme Output 4
    • 233262165 comme Input 5 et 233-26-2165 comme Output 5
  6. Cliquez sur Submit.

Résultats

Une nouvelle colonne est créée, le transformation de vos exemples y est appliquée au reste des numéros. Les numéros de Sécurité Sociale sont désormais correctement formatés et sont détectés comme tels, comme le montre le type sémantique de l'en-tête de cette nouvelle colonne. Vous pouvez à présent supprimer l'autre colonne aux données invalides.