Texte non structuré - 7.0

Guide d'utilisation de Talend Open Studio for Data Quality

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Open Studio for Data Quality
task
Création et développement
EnrichPlatform
Studio Talend

Ce type est un nouveau type de data mining type introduit par le Studio. Ce type de data mining est dédié à la gestion de données textuelles non structurées.

Par exemple, le type de data mining type d'une colonne appelée COMMENT contenant des commentaires ne peut être Nominal, puisque le texte n'est pas structuré. Cependant, il peut être intéressant de voir les valeurs en doublon d'une telle colonne, d'où la nécessité d'un nouveau type de data mining.