Texte non structuré - 6.1

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce type est un nouveau type de data mining type introduit par le studio. Ce type de data mining est dédié à la gestion de données textuelles non structurées.

Par exemple, le type de data mining type d'une colonne appelée COMMENT contenant des commentaires ne peut être Nominal, puisque le texte n'est pas structuré. Cependant, il peut être intéressant de voir les valeurs en doublon d'une telle colonne, d'où la nécessité d'un nouveau type de data mining.