Vous pouvez modifier un type sémantique existant dans Talend Dictionary Service afin de changer la manière dont sont validées vos données dans Talend Data Preparation.
Les types sémantiques prédéfinis dans Talend Data Preparation se basent sur des valeurs standard, mais il est possible que vous deviez les adapter pour qu'ils correspondent à vos données. Certaines données que vous considérez comme appartenant à une catégorie prédéfinie peuvent être considérées comme invalides.
Prenez l'exemple d'un jeu de données contenant une liste de clients, avec leur adresse e-mail, date de naissance et leur pays de résidence. Vous pouvez constater que toutes les entrées pour United States of America sont considérées comme invalides, alors qu'elles ne devraient pas, puisque c'est le nom officiel du pays.
Le problème est que United States of America n'est pas une valeur attendue pour le type sémantique country
, dans Talend Data Preparation. L'entrée valide serait United States.
Pour éviter de futurs problèmes, vous allez mettre à jour le type sémantique country
dans Talend Dictionary Service et ajouter United States of America
à la liste des entrées valides. Cette modification sera automatiquement disponible dans Talend Data Preparation.
Procédure
Résultats
Le type sémantique country
a été mis à jour manuellement afin de supporter une nouvelle valeur.
À partir de maintenant, lorsque vous traitez des données rapprochées du type sémantique country
, United States of America sera considérée comme une valeur valide.
Pour afficher une liste de toutes les commandes disponibles dans Talend Dictionary Service, allez au niveau <Dictionary_Service_Path>/command-line et saisissez la commande suivante, selon votre système d'exploitation :
- commande
category_manager.bat -h
pour Windows - commande
./category_manager.sh -h
pour Linux.