热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

如何确定聚类簇数(k)

现有的许多传统聚类方法,比如说k-means算法,在聚类之前,聚类簇数(k)是需要提前给定的。然而࿰

现有的许多传统聚类方法,比如说k-means算法,在聚类之前,聚类簇数(k)是需要提前给定的。然而,对于一个数据集,我们大概率也不会知道它的自然簇数。本次博客主要目前有什么方法可以获取到聚类簇数(k)?
[参考sklearn]

  • 组内平方误差和——拐点图
  • Calinski and Harabasz score
  • 轮廓系数Average silhouette method
    s(i)=b(i)−a(i)max⁡(a(i),b(i))s(i) = \frac{b(i)-a(i)}{\max(a(i),b(i))} s(i)=max(a(i),b(i))b(i)a(i)
  • Gap Statistic
  • gap statistic-Tibshirani R, Walther G, Hastie T. Estimating the number of clusters in a data set via the gap statistic[J]. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 2001, 63(2): 411-423.

在这里插入图片描述


推荐阅读
author-avatar
哈哈1991188
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有