tMahoutClustering (非推奨) - 7.2

Machine Learning

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 機械学習コンポーネント
データガバナンス > サードパーティーシステム > 機械学習コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 機械学習コンポーネント

ラベル付けされていない数値データをグルーピングしてクラスターにすると、興味深いパターンが明らかになったり、データセット内の異常なデータアイテムを識別したりできます。

tMahoutClusteringは、いくつかの類似点に基づいてデータをグルーピングしてクラスターにします。このコンポーネントは、さまざまなクラスタリングアルゴリズムで使えるいくつかの類似性メソッドを提供します。

tMahoutClusteringは、Mahoutライブラリーのクラスタリングアルゴリズムを使います。すべてのプロセスは、特定の分散ファイルシステムで実行されます。

注:

現在、StudioはMahout 0.9をサポートしています。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。