分级聚类算法

作者：捕鱼达人2602929461 | 来源：互联网 | 2024-10-18 14:40

分级聚类算法以一组对应于原始数据项的聚类开始。函数的主循环部分会尝试每一组可能的配对并计算他们的相关度，以此来找出最佳配对。最佳配对的两个聚类会被合并成一个新的聚类。新生成的聚类

　　分级聚类算法以一组对应于原始数据项的聚类开始。函数的主循环部分会尝试每一组可能的配对并计算他们的相关度，以此来找出最佳配对。最佳配对的两个聚类会被合并成一个新的聚类。新生成的聚类中所包含的数据，等于将两个旧聚类的数据求均值之后得到的结果。循环下去，一直到只剩下一个聚类为止。

python实现代码：

def hcluster(rows,distance=pearson):
  distances={}
  currentclustid=-1

  # Clusters are initially just the rows
  clust=[bicluster(rows[i],id=i) for i in range(len(rows))]

  while len(clust)>1:
    lowestpair=(0,1)
    closest=distance(clust[0].vec,clust[1].vec)
    print "closest",closest
    # loop through every pair looking for the smallest distance
    for i in range(len(clust)):
      for j in range(i+1,len(clust)):
        # distances is the cache of distance calculations
        if (clust[i].id,clust[j].id) not in distances: 
          distances[(clust[i].id,clust[j].id)]=distance(clust[i].vec,clust[j].vec)

        d=distances[(clust[i].id,clust[j].id)]

        if d<closest:
          closest=d
          lowestpair=(i,j)

    # calculate the average of the two clusters
    mergevec=[
    (clust[lowestpair[0]].vec[i]+clust[lowestpair[1]].vec[i])/2.0 
    for i in range(len(clust[0].vec))]

    # create the new cluster
    newcluster=bicluster(mergevec,left=clust[lowestpair[0]],
                         right=clust[lowestpair[1]],
                         distance=closest,id=currentclustid)

    # cluster ids that weren't in the original set are negative
    currentclustid-=1
    del clust[lowestpair[1]]
    del clust[lowestpair[0]]
    clust.append(newcluster)

  return clust[0]

推荐阅读

range
python定义函数累加,python中的累加

用python如何自定义一个包含一个参数的函数,函数从一累加到参数的值,返回累加？defcursum(n):res0foriinrange(1,n+1):res+1returnre ... [详细]

蜡笔小新 2024-10-18 15:20:35
range
python基本函数用法,python常用函数和方法

Python中range()函数的用法此刻的心情：2018年五一后入职新公司做项目实施，一直忙碌着公司的项目；国庆后更是被调到东莞支援项目，工作时间真的成了996了，唯一休息的一天 ... [详细]

蜡笔小新 2024-10-18 09:09:37
range
浅谈php7的重大新特性_PHP 7.4.0刚刚发布！一起看看有哪些新特性

php中文网最新课程每日17点准时技术干货分享PHP7.4.0发布了，此版本标志着PHP7系列的第四次特性更新。PHP7.4.0进行了许多改进，并带来了 ... [详细]

蜡笔小新 2024-10-17 16:16:39
uri
android图片拍照,手机图片拍照

Android使用系统相机拍照和读取相册照片1.拍照（对于7.0以上的版本，不在允许直接访问uri）`若不指定输出路径intent.putExtra(MediaStore.EXTR ... [详细]

蜡笔小新 2024-10-17 15:05:24
get
Android 使用实现简单的音乐播放以及管理

这里主要通过MediaPlayer以及AudioManager来实现的对应的功能。1.第一种，播放本地媒体文件：你需要自己准备一个MP3格式的音频文件；然后在资源目录(res)里面 ... [详细]

蜡笔小新 2024-10-18 12:32:12
get
【应用服务AppService】快速获取DUMP文件(AppServiceforWindows(.NET/.NETCore))

问题情形当应用在Azure应用服务AppService中运行时，有时候出现CPU,Memory很高，但是没有明显的5XX错误和异常日志，有时就是有异常但是也不能明确的指出具体的代码 ... [详细]

蜡笔小新 2024-10-18 12:05:04
range
mysql exit 意义,mysql explain用法和结果的含义

转自：http:blog.chinaunix.netuid-540802-id-3419311.htmlexplain显示了mysql如何使用索引来处理select语 ... [详细]

蜡笔小新 2024-10-17 14:09:00
range
europe_Jun.1617th 11 Spots | European Town+LakeView Hotel+BBQ+Raft

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Jun.16-17th11Spots|EuropeanTown+Lake-ViewHotel+BBQ+Raft相关的知识，希望对你有 ... [详细]

蜡笔小新 2024-10-17 12:25:14
range
python实现二十四点

给定n个数字,计算出一个满足24点的表达式:比如1,11,2,1:(111)*21基本思路就是枚举计算顺序(在一开始进行一次全排列),括号,加减乘除。其实有很多是重复计算过了的。 ... [详细]

蜡笔小新 2024-10-16 14:14:20
range
Python学习之对象基础

Python对象特性0x01:所有Python对象都有三个特性以及属性*身份：每一个对象都有一个唯一的身份标识自己，任何一个都可以用内建函数id（）来得到。*类型：决定了可以保存什 ... [详细]

蜡笔小新 2024-10-16 12:34:36
range
联邦学习: 联邦场景下的时空数据挖掘

不论你望得多远，仍然有无限的空间在外边，不论你数多久，仍然有无限的时间数不清。——惠特曼《自己之歌》1.导引时空数据挖掘做为智慧城市的重要组成部分，和我们的日常生活息息相关。如我 ... [详细]

蜡笔小新 2024-10-15 19:50:26
range
python绘制拟合回归散点图_机器学习之利用Python进行简单线性回归分析

前言：在利用机器学习方法进行数据分析时经常要了解变量的相关性，有时还需要对变量进行回归分析。本文首先对人工智能机器学习深度学习、相关分析因果分析回归分析 ... [详细]

蜡笔小新 2024-10-15 16:59:18
range
开发笔记:高效算法求解数独

篇首语：本文由编程笔记#小编为大家整理，主要介绍了高效算法求解数独相关的知识，希望对你有一定的参考价值。title:高效算法求解数独 ... [详细]

蜡笔小新 2024-10-15 15:01:47
uri
Python基础（四）文件

本文是我在学习期间的笔记，看的书是《python语言及其应用》。转载请注明出处，谢谢。本文链接https:blog.csdn.netMing201712 ... [详细]

蜡笔小新 2024-10-15 11:26:57
range
分布式集群_MySQL分布式集群之MyCATrule的分析

篇首语：本文由编程笔记#小编为大家整理，主要介绍了MySQL分布式集群之MyCATrule的分析相关的知识，希望对你有一定的参考价值。首先写在最前面，MyCA ... [详细]

蜡笔小新 2024-10-14 16:12:45

捕鱼达人2602929461

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章