热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

聚类KMeans

1、什么是K均值聚类k均值聚类是最简单也是最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心(ClusterCenter)K-means算法过程1.随机布置K个特征空间内的点

1、什么是K均值聚类



  • k均值聚类是最简单也是最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心(Cluster Center)



  • K-means算法过程

    1.随机布置K个特征空间内的点作为初始的聚类中心

    2.对于根据每个数据的特征向量,从K个聚类中心中寻找距离最近的一个,并且把该数据标记为从属这个聚类中心

    3.在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心做计算

    4.如果一轮下来,所有的数据点从属的聚类中心与上一次的分配的类簇没有变化,那么可以迭代停止,否者回到第2步继续循环

    mglearn.plots.plot_kmeans_algorithm()


mglearn.plots.plot_kmeans_boundaries()


2、KMeans应用于模拟数据

#获取数据集
X, y = make_blobs(n_samples=100,n_features=2,random_state=42)
#Kmeans模型实例化
kmeans = KMeans(n_clusters=3,random_state=0)
kmeans=kmeans.fit(X)
#打印kmeans.labels_属性
print("labels:{}".format(kmeans.labels_))


推荐阅读
author-avatar
十饮魂
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有