Ce composant regroupe des données numériques n'ayant pas de libellé dans des clusters, ce qui permet de révéler des modèles ou d'identifier des éléments de données anormaux au sein des ensembles de données.
Le composant tMahoutClustering regroupe des données dans des clusters selon certaines similarités. Ce composant offre des méthodes de calculs pouvant être utilisés dans différents algorithmes de clustering.
Ce composant utilise des algorithmes de clustering des bibliothèques Mahout. Tous les processus sont exécutés dans un système de fichiers distribué.
Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.