分级聚类算法

作者：捕鱼达人2602929461 | 来源：互联网 | 2024-10-18 14:40

分级聚类算法以一组对应于原始数据项的聚类开始。函数的主循环部分会尝试每一组可能的配对并计算他们的相关度，以此来找出最佳配对。最佳配对的两个聚类会被合并成一个新的聚类。新生成的聚类

　　分级聚类算法以一组对应于原始数据项的聚类开始。函数的主循环部分会尝试每一组可能的配对并计算他们的相关度，以此来找出最佳配对。最佳配对的两个聚类会被合并成一个新的聚类。新生成的聚类中所包含的数据，等于将两个旧聚类的数据求均值之后得到的结果。循环下去，一直到只剩下一个聚类为止。

python实现代码：

def hcluster(rows,distance=pearson):
  distances={}
  currentclustid=-1

  # Clusters are initially just the rows
  clust=[bicluster(rows[i],id=i) for i in range(len(rows))]

  while len(clust)>1:
    lowestpair=(0,1)
    closest=distance(clust[0].vec,clust[1].vec)
    print "closest",closest
    # loop through every pair looking for the smallest distance
    for i in range(len(clust)):
      for j in range(i+1,len(clust)):
        # distances is the cache of distance calculations
        if (clust[i].id,clust[j].id) not in distances: 
          distances[(clust[i].id,clust[j].id)]=distance(clust[i].vec,clust[j].vec)

        d=distances[(clust[i].id,clust[j].id)]

        if d<closest:
          closest=d
          lowestpair=(i,j)

    # calculate the average of the two clusters
    mergevec=[
    (clust[lowestpair[0]].vec[i]+clust[lowestpair[1]].vec[i])/2.0 
    for i in range(len(clust[0].vec))]

    # create the new cluster
    newcluster=bicluster(mergevec,left=clust[lowestpair[0]],
                         right=clust[lowestpair[1]],
                         distance=closest,id=currentclustid)

    # cluster ids that weren't in the original set are negative
    currentclustid-=1
    del clust[lowestpair[1]]
    del clust[lowestpair[0]]
    clust.append(newcluster)

  return clust[0]

推荐阅读

io
深入解析Java中的锁类型及其应用场景

本文详细介绍了Java中常见的锁类型，包括乐观锁与悲观锁、独占锁与共享锁、互斥锁与读写锁、可重入锁、公平锁与非公平锁、分段锁、偏向锁、轻量级锁、重量级锁以及自旋锁。每种锁的特性、作用及适用场景均有所涉及。 ... [详细]

蜡笔小新 2024-12-04 14:45:08
blob
oracle中的数据集合操作

一、数据更新操作DML语法中主要包括两个内容：查询与更新，更新主要包括：增加数据、修改数据、删除数据。其中这些操作是离不开查询的。1、增加数据语法：INSERTINTO表名称[(字 ... [详细]

蜡笔小新 2024-12-04 12:15:42
go
CGroups: 资源管理和控制

CGroups（Control Groups）是Linux内核提供的一个功能，旨在限制、记录和隔离进程组使用的物理资源，如CPU、内存和I/O等。它通过精细的资源管理，支持现代容器技术如Docker的资源限制需求。 ... [详细]

蜡笔小新 2024-12-04 15:19:11
io
Hive 创建表语法详解

本文详细介绍了在Hive中创建表的基本语法，包括临时表、外部表的创建方法，以及如何设置表的各种属性和约束条件。 ... [详细]

蜡笔小新 2024-12-04 14:16:49
object
使用Epoll构建高效Web服务器

本文介绍如何利用Python中的Epoll机制构建一个高效的Web服务器，该服务器能够处理多个并发连接，并向每个连接的客户端返回预定义的响应文本。通过使用Epoll，服务器可以实现高性能的I/O多路复用。 ... [详细]

蜡笔小新 2024-12-04 12:47:07
object
OpenGL 实现骨骼动画平滑过渡技巧

本文深入探讨了如何使用 OpenGL 实现骨骼动画之间的平滑过渡效果，重点介绍了动画数据的管理及混合算法的具体实现。 ... [详细]

蜡笔小新 2024-12-04 11:15:24
io
特斯拉超级散户：坐拥631万股价值逾70亿美元

特斯拉股价上周五收盘上涨3.43%，达到1114美元，这意味着KoGuan能够以当前价格的一半购入特斯拉股票。据透露，KoGuan持有的特斯拉股份市值已超过70亿美元。KoGuan表示，投资成功的关键在于对特斯拉CEO埃隆·马斯克的信任。 ... [详细]

蜡笔小新 2024-12-04 10:46:05
io
PHP与MySQL Web开发初探——第一章概览

本文详细记录了《PHP与MySQL Web开发》第一章的学习心得，特别关注了PHP的基本构成元素、标记风格、编程注意事项及表单处理技巧等内容。 ... [详细]

蜡笔小新 2024-12-04 08:25:58
io
解决 aiohttp 中 HTTPS 请求的 SSL 证书问题

本文介绍了如何处理在使用 aiohttp 进行 HTTPS 请求时遇到的 SSL 证书验证错误，包括忽略证书验证和使用自定义证书的方法。 ... [详细]

蜡笔小新 2024-12-04 05:20:03
object
利用VBA与FSO对象提取文件夹内文件名并生成超链接至Excel

本文通过一个实际案例，详细介绍了如何使用Excel VBA和FSO（FileSystemObject）对象来提取指定文件夹中的所有文件名称，并将其以超链接的形式添加到Excel表格中。 ... [详细]

蜡笔小新 2024-12-03 19:52:45
io
Java中重写toString方法引发的StackOverflowError问题分析与解决

本文探讨了在Java应用中，由于对象间循环引用导致重写toString方法时出现StackOverflowError的具体情况，并提供了有效的解决方案。 ... [详细]

蜡笔小新 2024-12-03 18:39:22
replace
mysql 分库分表策略_【数据库】分库分表策略

关系型数据库本身比较容易成为系统瓶颈，单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后，由于查询维度较多， ... [详细]

蜡笔小新 2024-12-03 13:09:47
range
使用Python轻松合并大量复杂Excel文件

当面对大量的Excel文件时，如何高效地将它们合并成一个文件成为了一项挑战。本文将指导初学者如何利用Python的几个库，在几十行代码内完成这一任务。 ... [详细]

蜡笔小新 2024-12-03 12:29:23
object
14.并发与异步

线程是创建并发的底层工具，因此具有一定的局限性。没有简单的方法可以从联合（Join）线程得到“返回值”。因此必须创建一些共享域。当抛出一个异常时，捕捉和处理异常也是麻烦的。线程完成之后，无法再次启动该 ... [详细]

蜡笔小新 2024-12-03 06:21:05
go
Zsh 开发指南（第三篇字符串处理之转义字符和格式化输出）

导读上一篇讲了zsh的常用字符串操作，这篇开始讲更为琐碎的转义字符和格式化输出相关内容。包括转义字符、引号、print、printf的使用等等。其中很多内容没有必要记忆，作为手册参 ... [详细]

蜡笔小新 2024-12-03 03:30:40

捕鱼达人2602929461

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章