国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python聚類算法之基本K均值實例詳解

2020-01-04 17:56:14
字體:
來源:轉載
供稿:網友

這篇文章主要介紹了Python聚類算法之基本K均值運算技巧,結合實例形式較為詳細的分析了基本K均值的原理與相關實現技巧,具有一定參考借鑒價值,需要的朋友可以參考下

本文實例講述了Python聚類算法之基本K均值運算技巧。分享給大家供大家參考,具體如下:

基本K均值

:選擇 K 個初始質心,其中 K 是用戶指定的參數,即所期望的簇的個數。每次循環中,每個點被指派到最近的質心,指派到同一個質心的點集構成一個。然后,根據指派到簇的點,更新每個簇的質心。重復指派和更新操作,直到質心不發生明顯的變化。

 

 
  1. # scoding=utf-8 
  2. import pylab as pl 
  3. points = [[int(eachpoint.split("#")[0]), int(eachpoint.split("#")[1])] for eachpoint in open("points","r")] 
  4. # 指定三個初始質心 
  5. currentCenter1 = [20,190]; currentCenter2 = [120,90]; currentCenter3 = [170,140] 
  6. pl.plot([currentCenter1[0]], [currentCenter1[1]],'ok'
  7. pl.plot([currentCenter2[0]], [currentCenter2[1]],'ok'
  8. pl.plot([currentCenter3[0]], [currentCenter3[1]],'ok'
  9. # 記錄每次迭代后每個簇的質心的更新軌跡 
  10. center1 = [currentCenter1]; center2 = [currentCenter2]; center3 = [currentCenter3] 
  11. # 三個簇 
  12. group1 = []; group2 = []; group3 = [] 
  13. for runtime in range(50): 
  14. group1 = []; group2 = []; group3 = [] 
  15. for eachpoint in points: 
  16. # 計算每個點到三個質心的距離 
  17. distance1 = pow(abs(eachpoint[0]-currentCenter1[0]),2) + pow(abs(eachpoint[1]-currentCenter1[1]),2) 
  18. distance2 = pow(abs(eachpoint[0]-currentCenter2[0]),2) + pow(abs(eachpoint[1]-currentCenter2[1]),2) 
  19. distance3 = pow(abs(eachpoint[0]-currentCenter3[0]),2) + pow(abs(eachpoint[1]-currentCenter3[1]),2) 
  20. # 將該點指派到離它最近的質心所在的簇 
  21. mindis = min(distance1,distance2,distance3) 
  22. if(mindis == distance1): 
  23. group1.append(eachpoint) 
  24. elif(mindis == distance2): 
  25. group2.append(eachpoint) 
  26. else
  27. group3.append(eachpoint) 
  28. # 指派完所有的點后,更新每個簇的質心 
  29. currentCenter1 = [sum([eachpoint[0] for eachpoint in group1])/len(group1),sum([eachpoint[1] for eachpoint in group1])/len(group1)] 
  30. currentCenter2 = [sum([eachpoint[0] for eachpoint in group2])/len(group2),sum([eachpoint[1] for eachpoint in group2])/len(group2)] 
  31. currentCenter3 = [sum([eachpoint[0] for eachpoint in group3])/len(group3),sum([eachpoint[1] for eachpoint in group3])/len(group3)] 
  32. # 記錄該次對質心的更新 
  33. center1.append(currentCenter1) 
  34. center2.append(currentCenter2) 
  35. center3.append(currentCenter3) 
  36. # 打印所有的點,用顏色標識該點所屬的簇 
  37. pl.plot([eachpoint[0] for eachpoint in group1], [eachpoint[1] for eachpoint in group1], 'or'
  38. pl.plot([eachpoint[0] for eachpoint in group2], [eachpoint[1] for eachpoint in group2], 'oy'
  39. pl.plot([eachpoint[0] for eachpoint in group3], [eachpoint[1] for eachpoint in group3], 'og'
  40. # 打印每個簇的質心的更新軌跡 
  41. for center in [center1,center2,center3]: 
  42. pl.plot([eachcenter[0] for eachcenter in center], [eachcenter[1] for eachcenter in center],'k'
  43. pl.show() 

運行效果截圖如下:

Python聚類算法之基本K均值實例詳解

希望本文所述對大家Python程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 建平县| 淮滨县| 嘉定区| 治多县| 栾城县| 铅山县| 法库县| 永兴县| 荥经县| 防城港市| 疏附县| 和静县| 郧西县| 卢氏县| 平山县| 怀集县| 吉林市| 绵阳市| 页游| 盖州市| 青海省| 仁怀市| 临湘市| 银川市| 南靖县| 永泰县| 含山县| 上思县| 鹤峰县| 忻州市| 大兴区| 黔西县| 华容县| 达尔| 铜梁县| 嘉善县| 内黄县| 安顺市| 正阳县| 昭觉县| 罗江县|