热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

论文阅读(三):MultiInstanceClusteringwithApplicationstoMultiInstancePrediction.(BAMIC)

文章目录引入学前娱乐提出问题BAMIC(BAg-levelMulti-InstanceClustering)算法一:BAMIC输入:输出:

文章目录

  • 引入
  • 学前娱乐
  • 提出问题
  • BAMIC (BAg-level Multi-Instance Clustering )
  • 算法一:BAMIC
    • 输入 :
    • 输出 :
    • 过程
  • 算法二 映射
    • 输入
    • 输出
    • 过程
  • 总结


引入

  论文地址

学前娱乐

很久很久以前,在森林中有一一个老虎王国,老虎国王生下了一对兄妹。哥哥拥有一双千里眼,可以看到千里之外的事物,妹妹拥有一双顺风耳,可以听到千里之外的声音。哥哥和妹妹每天幸福的生活在一-起,哥哥总是给妹妹讲起他在千里外看到的景色,妹妹则给哥哥讲述千里之外的美妙乐曲。渐渐的,他们相爱了,但亲兄妹是不能在-起的,兄妹两伤心欲绝,哥哥戳瞎了自己的眼睛,他认为,如果不能和妹妹在一起,那他有这样一双眼睛,又有什么用呢?妹妹弄聋了自己的耳朵,她认为,如果不能和哥哥在一起那样,这样- -双耳朵就没什么用了。许多年以后,一个作曲家听说他们的故事,他在这对老虎兄妹感动,于是创作了一段曲子,调我不记得了,不过歌词是这样的:“两只老虎,两只老虎,跑得快,跑得快。一只没有眼睛,一只没有耳朵, 真奇怪,真奇怪。”


提出问题

   由于之前的学习都是建议在有监督上面的,尚未研究没有标签的包的无监督多实例学习。BAMIC 就是来解决这个问题的;
   先把一个包看作一个原子数据,然后使用某种方式来计算包之间的距离,BAMIC 采用的是流行的 K−MEDIODSK-MEDIODSKMEDIODS 算法来将未带标签的包分成 kkk 个不相关的包;
  基于上面的聚类结果,一种新的多示例预测算法 BARTMIPBARTMIPBARTMIP 也被提出;
  首先,每一个包都会被映射成一个 kkk 维向量,第 iii 个特征值是与第 iii 个聚类中心的距离;
  将包转换为特征向量,以便普通的受监督学习者从转换后的特征向量中学习,每个向量都与原始包的标签相关联。

BAMIC (BAg-level Multi-Instance Clustering )

  其实,说白了,BAMICBAMICBAMIC 就是在包的水平上聚类,用的聚类方式是 K−MEDIODSK-MEDIODSKMEDIODS ,采用的距离度量则是 Hausdorff ,在 BAMICBAMICBAMIC 基础上,又提出了 BARTMIPBARTMIPBARTMIP (BAg-level Representation Transformation for Multi-Instance Prediction) ,BARTMIPBARTMIPBARTMIP 则是把每个包映射成一个 kkk 维向量,其中第 iii 个特征向量是包与第 iii 个聚类簇的距离。

算法一:BAMIC

在BAMIC聚类中,由于他是在包级别的聚类,因此不能直接调用sklearn的KMeans,只有自己写一次。
在这里插入图片描述

输入 :

  1)训练包;
  2)聚类簇数量;
  2)每个包之间的距离 (包之间的距离由 Hausdorff 公式给出)。
提示:关于 Hausdorff 公式 可以自己去了解一下。

输出 :

  1)每一个簇集合;
  2)簇中心。

过程

  1)先随机选取训练包中的 kkk 个包来当簇中心;
  2)然后计算其余包与这 kkk 个包的距离,将其分配给离他最近的那个簇;
  3)接下来算每个簇中包之间的距离,距离最小的那个包,就是新的簇中心;
  4)重复 2-3,直到簇中心不在变化或者达到一定的迭代次数;
  5)得到 kkk 个簇中心和簇。

算法二 映射

  这部分就更好理解了,就是将BAMIC选出来的簇中心 CCC ,然后每一个包对这些簇中心都会有一个距离,这些距离组成一个 kkk 维的向量 ;因此每一个包都会被映射成一个 kkk 维的向量。
在这里插入图片描述

输入

  1)训练包(带标签),测试包;
  2)包之间的距离 Bag_dist ;
  3)学习器(分类器)。

输出

  测试标签。

过程

  1)由算法一BAMIC获得 kkk 个簇中心;
  2)然后每一个包都会对这 kkk 个簇中心来计算一个距离,这 kkk 个距离组成一个kkk 维的向量。
  3)最后通过SVM 分类器来对训练包的一个向量来得到一个模型,用这个模型来对映射后的测试包来进行预测。得到一组测试标签,输出。

总结

  其实每一篇论文只要弄清楚了之后,思路要很清晰,这样我们就会对每一步都掌握的很好,也不至于看到论文就头痛,要静下心来学习,得到一个有效的进步。


推荐阅读
  • Python进阶笔记:深入理解装饰器、生成器与迭代器的应用
    本文深入探讨了Python中的装饰器、生成器和迭代器的应用。装饰器本质上是一个函数,用于在不修改原函数代码和调用方式的前提下为其添加额外功能。实现装饰器需要掌握闭包、高阶函数等基础知识。生成器通过 `yield` 语句提供了一种高效生成和处理大量数据的方法,而迭代器则是一种可以逐个访问集合中元素的对象。文章详细解析了这些概念的原理和实际应用案例,帮助读者更好地理解和使用这些高级特性。 ... [详细]
  • 计算机视觉领域介绍 | 自然语言驱动的跨模态行人重识别前沿技术综述(上篇)
    本文介绍了计算机视觉领域的最新进展,特别是自然语言驱动的跨模态行人重识别技术。上篇内容详细探讨了该领域的基础理论、关键技术及当前的研究热点,为读者提供了全面的概述。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 在处理多个玩家的相机控制时,我遇到了一个挑战,即无法在运行时动态添加播放器子对象以转换数组类型。为了解决这个问题,我在 `CameraControl.cs` 脚本中采取了临时措施。该脚本负责根据玩家的数量动态调整相机的缩放范围,确保所有玩家都能被相机捕捉到。 ... [详细]
  • 如何使用 net.sf.extjwnl.data.Word 类及其代码示例详解 ... [详细]
  • 期末Web开发综合实践项目:运用前端技术打造趣味小游戏体验
    期末Web开发综合实践项目中,学生通过运用HTML、CSS和JavaScript等前端技术,设计并实现了一款趣味性十足的小游戏。该项目不仅检验了学生对前端基础知识的掌握情况,还提升了他们的实际操作能力和创意设计水平。视频链接展示了项目的最终成果,直观呈现了游戏的互动性和视觉效果。 ... [详细]
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • Squaretest:自动生成功能测试代码的高效插件
    本文将介绍一款名为Squaretest的高效插件,该工具能够自动生成功能测试代码。使用这款插件的主要原因是公司近期加强了代码质量的管控,对各项目进行了严格的单元测试评估。Squaretest不仅提高了测试代码的生成效率,还显著提升了代码的质量和可靠性。 ... [详细]
  • 第六章:枚举类型与switch结构的应用分析
    第六章深入探讨了枚举类型与 `switch` 结构在编程中的应用。枚举类型(`enum`)是一种将一组相关常量组织在一起的数据类型,广泛存在于多种编程语言中。例如,在 Cocoa 框架中,处理文本对齐时常用 `NSTextAlignment` 枚举来表示不同的对齐方式。通过结合 `switch` 结构,可以更清晰、高效地实现基于枚举值的逻辑分支,提高代码的可读性和维护性。 ... [详细]
  • 每日前端实战:148# 视频教程展示纯 CSS 实现按钮两侧滑入装饰元素的悬停效果
    通过点击页面右侧的“预览”按钮,您可以直接在当前页面查看效果,或点击链接进入全屏预览模式。该视频教程展示了如何使用纯 CSS 实现按钮两侧滑入装饰元素的悬停效果。视频内容具有互动性,观众可以实时调整代码并观察变化。访问以下链接体验完整效果:https://codepen.io/comehope/pen/yRyOZr。 ... [详细]
  • 希尔伯特曲线是一种能够完全填充平面正方形的分形曲线,最早由数学家大卫·希尔伯特于1891年提出。该曲线具有二维豪斯多夫维数,表明其能够完全覆盖平面区域。当所填充的正方形边长为1时,第n阶希尔伯特曲线的总长度为2^n。本文详细探讨了希尔伯特曲线的空间填充算法实现,并对其在多个实际应用中的性能进行了深入分析。 ... [详细]
  • 如何精通编程语言:全面指南与实用技巧
    如何精通编程语言:全面指南与实用技巧 ... [详细]
  • 在JavaScript中,定位属性是理解元素布局的关键。本文通过详细的图示解析,介绍了这些属性的基础概念。以`clientHeight`为例,它表示元素的可见内容区域高度,不包括边距(margin)、边框(border)和滚动条。同样,`clientWidth`则表示元素的可见内容区域宽度。这些属性对于精确控制页面元素的尺寸和位置至关重要。 ... [详细]
  • 视觉图像的生成机制与英文术语解析
    近期,Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机(MLP)在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制,并解析了相关技术术语,为理解视觉图像生成提供了新的视角和方法。 ... [详细]
  • 深入理解Spark框架:RDD核心概念与操作详解
    RDD是Spark框架的核心计算模型,全称为弹性分布式数据集(Resilient Distributed Dataset)。本文详细解析了RDD的基本概念、特性及其在Spark中的关键操作,包括创建、转换和行动操作等,帮助读者深入理解Spark的工作原理和优化策略。通过具体示例和代码片段,进一步阐述了如何高效利用RDD进行大数据处理。 ... [详细]
author-avatar
书苑幽香
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有