如何评价聚类结果的好坏

如题所述

基于不同算法,会有不同指标,通常较通用的应该一定都会有Entropy 熵 和 Accuracy, Accuracy 里可以包含了precision, recall, f-measure.
假设我们使用k-means算法,通常会加上SSE (Sum of squared errors)平方误差和,其他算法会有不同指标。
总体思想为一个cluster聚类内的数据点聚集在一起的密度越高,圈子越小,离centroid中心点越近,那么这个聚类的总体质量相对来说就会越好。
温馨提示:内容为网友见解,仅供参考
无其他回答
相似回答