热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

论文阅读(三):MultiInstanceClusteringwithApplicationstoMultiInstancePrediction.(BAMIC)

文章目录引入学前娱乐提出问题BAMIC(BAg-levelMulti-InstanceClustering)算法一:BAMIC输入:输出:

文章目录

  • 引入
  • 学前娱乐
  • 提出问题
  • BAMIC (BAg-level Multi-Instance Clustering )
  • 算法一:BAMIC
    • 输入 :
    • 输出 :
    • 过程
  • 算法二 映射
    • 输入
    • 输出
    • 过程
  • 总结


引入

  论文地址

学前娱乐

很久很久以前,在森林中有一一个老虎王国,老虎国王生下了一对兄妹。哥哥拥有一双千里眼,可以看到千里之外的事物,妹妹拥有一双顺风耳,可以听到千里之外的声音。哥哥和妹妹每天幸福的生活在一-起,哥哥总是给妹妹讲起他在千里外看到的景色,妹妹则给哥哥讲述千里之外的美妙乐曲。渐渐的,他们相爱了,但亲兄妹是不能在-起的,兄妹两伤心欲绝,哥哥戳瞎了自己的眼睛,他认为,如果不能和妹妹在一起,那他有这样一双眼睛,又有什么用呢?妹妹弄聋了自己的耳朵,她认为,如果不能和哥哥在一起那样,这样- -双耳朵就没什么用了。许多年以后,一个作曲家听说他们的故事,他在这对老虎兄妹感动,于是创作了一段曲子,调我不记得了,不过歌词是这样的:“两只老虎,两只老虎,跑得快,跑得快。一只没有眼睛,一只没有耳朵, 真奇怪,真奇怪。”


提出问题

   由于之前的学习都是建议在有监督上面的,尚未研究没有标签的包的无监督多实例学习。BAMIC 就是来解决这个问题的;
   先把一个包看作一个原子数据,然后使用某种方式来计算包之间的距离,BAMIC 采用的是流行的 K−MEDIODSK-MEDIODSKMEDIODS 算法来将未带标签的包分成 kkk 个不相关的包;
  基于上面的聚类结果,一种新的多示例预测算法 BARTMIPBARTMIPBARTMIP 也被提出;
  首先,每一个包都会被映射成一个 kkk 维向量,第 iii 个特征值是与第 iii 个聚类中心的距离;
  将包转换为特征向量,以便普通的受监督学习者从转换后的特征向量中学习,每个向量都与原始包的标签相关联。

BAMIC (BAg-level Multi-Instance Clustering )

  其实,说白了,BAMICBAMICBAMIC 就是在包的水平上聚类,用的聚类方式是 K−MEDIODSK-MEDIODSKMEDIODS ,采用的距离度量则是 Hausdorff ,在 BAMICBAMICBAMIC 基础上,又提出了 BARTMIPBARTMIPBARTMIP (BAg-level Representation Transformation for Multi-Instance Prediction) ,BARTMIPBARTMIPBARTMIP 则是把每个包映射成一个 kkk 维向量,其中第 iii 个特征向量是包与第 iii 个聚类簇的距离。

算法一:BAMIC

在BAMIC聚类中,由于他是在包级别的聚类,因此不能直接调用sklearn的KMeans,只有自己写一次。
在这里插入图片描述

输入 :

  1)训练包;
  2)聚类簇数量;
  2)每个包之间的距离 (包之间的距离由 Hausdorff 公式给出)。
提示:关于 Hausdorff 公式 可以自己去了解一下。

输出 :

  1)每一个簇集合;
  2)簇中心。

过程

  1)先随机选取训练包中的 kkk 个包来当簇中心;
  2)然后计算其余包与这 kkk 个包的距离,将其分配给离他最近的那个簇;
  3)接下来算每个簇中包之间的距离,距离最小的那个包,就是新的簇中心;
  4)重复 2-3,直到簇中心不在变化或者达到一定的迭代次数;
  5)得到 kkk 个簇中心和簇。

算法二 映射

  这部分就更好理解了,就是将BAMIC选出来的簇中心 CCC ,然后每一个包对这些簇中心都会有一个距离,这些距离组成一个 kkk 维的向量 ;因此每一个包都会被映射成一个 kkk 维的向量。
在这里插入图片描述

输入

  1)训练包(带标签),测试包;
  2)包之间的距离 Bag_dist ;
  3)学习器(分类器)。

输出

  测试标签。

过程

  1)由算法一BAMIC获得 kkk 个簇中心;
  2)然后每一个包都会对这 kkk 个簇中心来计算一个距离,这 kkk 个距离组成一个kkk 维的向量。
  3)最后通过SVM 分类器来对训练包的一个向量来得到一个模型,用这个模型来对映射后的测试包来进行预测。得到一组测试标签,输出。

总结

  其实每一篇论文只要弄清楚了之后,思路要很清晰,这样我们就会对每一步都掌握的很好,也不至于看到论文就头痛,要静下心来学习,得到一个有效的进步。


推荐阅读
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了闭包的定义和运转机制,重点解释了闭包如何能够接触外部函数的作用域中的变量。通过词法作用域的查找规则,闭包可以访问外部函数的作用域。同时还提到了闭包的作用和影响。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • mysql-cluster集群sql节点高可用keepalived的故障处理过程
    本文描述了mysql-cluster集群sql节点高可用keepalived的故障处理过程,包括故障发生时间、故障描述、故障分析等内容。根据keepalived的日志分析,发现bogus VRRP packet received on eth0 !!!等错误信息,进而导致vip地址失效,使得mysql-cluster的api无法访问。针对这个问题,本文提供了相应的解决方案。 ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 突破MIUI14限制,自定义胶囊图标、大图标样式,支持任意APP
    本文介绍了如何突破MIUI14的限制,实现自定义胶囊图标和大图标样式,并支持任意APP。需要一定的动手能力和主题设计师账号权限或者会主题pojie。详细步骤包括应用包名获取、素材制作和封包获取等。 ... [详细]
  • 本文讨论了如何使用Web.Config进行自定义配置节的配置转换。作者提到,他将msbuild设置为详细模式,但转换却忽略了带有替换转换的自定义部分的存在。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 关于如何快速定义自己的数据集,可以参考我的前一篇文章PyTorch中快速加载自定义数据(入门)_晨曦473的博客-CSDN博客刚开始学习P ... [详细]
  • PRML读书会第十四章 Combining Models(committees,Boosting,AdaBoost,决策树,条件混合模型)...
    主讲人网神(新浪微博:豆角茄子麻酱凉面)网神(66707180)18:57:18大家好,今天我们讲一下第14章combiningmodel ... [详细]
  • LwebandStringTimeLimit:20001000MS(JavaOthers)MemoryLimit:6553665536K(JavaO ... [详细]
  • 支持向量机训练集多少个_25道题检测你对支持向量机算法的掌握程度
    介绍在我们学习机器算法的时候,可以将机器学习算法视为包含刀枪剑戟斧钺钩叉的一个军械库。你可以使用各种各样的兵器,但你要明白这些兵器是需要在合适的时间合理 ... [详细]
author-avatar
书苑幽香
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有