python怎么用sklearn包进行聚类

如题所述

举报该文章

相关建议 2016-08-17

# -*- coding: utf-8 -*-
from sklearn.cluster import KMeans
from sklearn.externals import joblib
import numpy

final = open('c:/test/final.dat' , 'r')

data = [line.strip().split('\t') for line in final]
feature = [[float(x) for x in row[3:]] for row in data]

#è°ç¨kmeansç±»
clf = KMeans(n_clusters=9)
s = clf.fit(feature)
print s

#9ä¸ªä¸å¿
print clf.cluster_centers_

#æ¯ä¸ªæ ·æ¬æå±çç°
print clf.labels_

#ç¨æ¥è¯ä¼°ç°çä¸ªæ°æ¯å¦åéï¼è·ç¦»è¶å°è¯´æç°åçè¶å¥½ï¼éåä¸´çç¹çç°ä¸ªæ°
print clf.inertia_

#è¿è¡é¢æµ
print clf.predict(feature)

#ä¿åæ¨¡å
joblib.dump(clf , 'c:/km.pkl')

#è½½å¥ä¿åçæ¨¡å
clf = joblib.load('c:/km.pkl')

'''
#ç¨æ¥è¯ä¼°ç°çä¸ªæ°æ¯å¦åéï¼è·ç¦»è¶å°è¯´æç°åçè¶å¥½ï¼éåä¸´çç¹çç°ä¸ªæ°
for i in range(5,30,1):
    clf = KMeans(n_clusters=i)
    s = clf.fit(feature)
    print i , clf.inertia_
'''

温馨提示：内容为网友见解，仅供参考

当前网址：https://11.t2y.org/zz/f247pvq72ps8v877spq.html

其他看法

第1个回答 2017-01-14

、K均值聚类 K-Means算法思想简单，效果却很好，是最有名的聚类算法。聚类算法的步骤如下： 1：初始化K个样本作为初始聚类中心； 2：计算每个样本点到K个中心的距离，选择最近的中心作为其分类，直到所有样本点分类完毕； 3：分别计算K个类中所...

相似回答

大家正在搜