论文里都说:K-Means算法对数据输入顺序敏感。怎么理解呢?
我的理解是:K-Means算法选取前K个点为中心,数据输入顺序不同,选取的K个中心点就不同,因此聚类结果不同。这个的根源还是K-Means算法对初始聚类中心的敏感性
而且,我做过实验,打乱了iris中数据的顺序,得到3个不同的数据集。但是我采用相同的中心,得到的结果是一样的。
大家是怎么理解:K-Means算法对数据输入顺序敏感的,这个问题的?
谢谢啊!
谢谢你的回答,你的回答很好,请问你可以举出这样的反例吗?谢谢你了
追答我暂时没空帮你构造反例……不过这位叫蔚蓝的朋友MS举了一种也算是反例的情况(等距离)。