tMahoutClustering (déprécié) - 6.5

Machine Learning

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Machine Learning
Gouvernance de données > Systèmes tiers > Composants Machine Learning
Qualité et préparation de données > Systèmes tiers > Composants Machine Learning
EnrichPlatform
Studio Talend

Ce composant regroupe des données numériques n'ayant pas de libellé dans des clusters, ce qui permet de révéler des modèles ou d'identifier des éléments de données anormaux au sein des ensembles de données.

Le composant tMahoutClustering regroupe des données dans des clusters selon certaines similarités. Ce composant offre des méthodes de calculs pouvant être utilisés dans différents algorithmes de clustering.

Ce composant utilise des algorithmes de clustering des bibliothèques Mahout. Tous les processus sont exécutés dans un système de fichiers distribué.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.