论文阅读（三）：MultiInstanceClusteringwithApplicationstoMultiInstancePrediction.（BAMIC）

作者：书苑幽香 | 来源：互联网 | 2023-10-16 13:22

文章目录引入学前娱乐提出问题BAMIC(BAg-levelMulti-InstanceClustering)算法一：BAMIC输入：输出：

文章目录

引入
学前娱乐
提出问题
BAMIC (BAg-level Multi-Instance Clustering )
算法一&＃xff1a;BAMIC
- 输入 &＃xff1a;
- 输出 &＃xff1a;
- 过程
算法二映射
- 输入
- 输出
- 过程
总结

引入

论文地址

学前娱乐

很久很久以前&＃xff0c;在森林中有一一个老虎王国&＃xff0c;老虎国王生下了一对兄妹。哥哥拥有一双千里眼&＃xff0c;可以看到千里之外的事物&＃xff0c;妹妹拥有一双顺风耳&＃xff0c;可以听到千里之外的声音。哥哥和妹妹每天幸福的生活在一-起&＃xff0c;哥哥总是给妹妹讲起他在千里外看到的景色&＃xff0c;妹妹则给哥哥讲述千里之外的美妙乐曲。渐渐的&＃xff0c;他们相爱了&＃xff0c;但亲兄妹是不能在-起的&＃xff0c;兄妹两伤心欲绝,哥哥戳瞎了自己的眼睛&＃xff0c;他认为&＃xff0c;如果不能和妹妹在一起&＃xff0c;那他有这样一双眼睛&＃xff0c;又有什么用呢?妹妹弄聋了自己的耳朵&＃xff0c;她认为&＃xff0c;如果不能和哥哥在一起那样&＃xff0c;这样- -双耳朵就没什么用了。许多年以后&＃xff0c;一个作曲家听说他们的故事,他在这对老虎兄妹感动&＃xff0c;于是创作了一段曲子&＃xff0c;调我不记得了&＃xff0c;不过歌词是这样的:“两只老虎&＃xff0c;两只老虎&＃xff0c;跑得快&＃xff0c;跑得快。一只没有眼睛&＃xff0c;一只没有耳朵, 真奇怪&＃xff0c;真奇怪。”

提出问题

由于之前的学习都是建议在有监督上面的&＃xff0c;尚未研究没有标签的包的无监督多实例学习。BAMIC 就是来解决这个问题的&＃xff1b;
先把一个包看作一个原子数据&＃xff0c;然后使用某种方式来计算包之间的距离&＃xff0c;BAMIC 采用的是流行的 $K - M E D I O D S$ 算法来将未带标签的包分成 $k$ 个不相关的包&＃xff1b;
基于上面的聚类结果&＃xff0c;一种新的多示例预测算法 $B A R T M I P$ 也被提出&＃xff1b;
首先&＃xff0c;每一个包都会被映射成一个 $k$ 维向量&＃xff0c;第 $i$ 个特征值是与第 $i$ 个聚类中心的距离&＃xff1b;
将包转换为特征向量&＃xff0c;以便普通的受监督学习者从转换后的特征向量中学习&＃xff0c;每个向量都与原始包的标签相关联。

BAMIC (BAg-level Multi-Instance Clustering )

其实&＃xff0c;说白了&＃xff0c; $B A M I C$ 就是在包的水平上聚类&＃xff0c;用的聚类方式是 $K - M E D I O D S$ ,采用的距离度量则是 Hausdorff &＃xff0c;在 $B A M I C$ 基础上&＃xff0c;又提出了 $B A R T M I P$ (BAg-level Representation Transformation for Multi-Instance Prediction) &＃xff0c; $B A R T M I P$ 则是把每个包映射成一个 $k$ 维向量&＃xff0c;其中第 $i$ 个特征向量是包与第 $i$ 个聚类簇的距离。

算法一&＃xff1a;BAMIC

在BAMIC聚类中&＃xff0c;由于他是在包级别的聚类&＃xff0c;因此不能直接调用sklearn的KMeans&＃xff0c;只有自己写一次。
在这里插入图片描述

输入 &＃xff1a;

1&＃xff09;训练包&＃xff1b;
2&＃xff09;聚类簇数量&＃xff1b;
2&＃xff09;每个包之间的距离 (包之间的距离由 Hausdorff 公式给出)。
提示&＃xff1a;关于 Hausdorff 公式可以自己去了解一下。

输出 &＃xff1a;

1&＃xff09;每一个簇集合&＃xff1b;
2&＃xff09;簇中心。

过程

1&＃xff09;先随机选取训练包中的 $k$ 个包来当簇中心&＃xff1b;
2&＃xff09;然后计算其余包与这 $k$ 个包的距离&＃xff0c;将其分配给离他最近的那个簇&＃xff1b;
3&＃xff09;接下来算每个簇中包之间的距离&＃xff0c;距离最小的那个包&＃xff0c;就是新的簇中心&＃xff1b;
4&＃xff09;重复 2-3&＃xff0c;直到簇中心不在变化或者达到一定的迭代次数&＃xff1b;
5&＃xff09;得到 $k$ 个簇中心和簇。

算法二映射

这部分就更好理解了&＃xff0c;就是将BAMIC选出来的簇中心 $C$ &＃xff0c;然后每一个包对这些簇中心都会有一个距离&＃xff0c;这些距离组成一个 $k$ 维的向量 &＃xff1b;因此每一个包都会被映射成一个 $k$ 维的向量。
在这里插入图片描述

输入

1&＃xff09;训练包&＃xff08;带标签&＃xff09;&＃xff0c;测试包&＃xff1b;
2&＃xff09;包之间的距离 Bag_dist ;
3&＃xff09;学习器&＃xff08;分类器&＃xff09;。

输出

测试标签。

过程

1&＃xff09;由算法一BAMIC获得 $k$ 个簇中心&＃xff1b;
2&＃xff09;然后每一个包都会对这 $k$ 个簇中心来计算一个距离&＃xff0c;这 $k$ 个距离组成一个 $k$ 维的向量。
3&＃xff09;最后通过SVM 分类器来对训练包的一个向量来得到一个模型&＃xff0c;用这个模型来对映射后的测试包来进行预测。得到一组测试标签&＃xff0c;输出。

总结

其实每一篇论文只要弄清楚了之后&＃xff0c;思路要很清晰&＃xff0c;这样我们就会对每一步都掌握的很好&＃xff0c;也不至于看到论文就头痛&＃xff0c;要静下心来学习&＃xff0c;得到一个有效的进步。

推荐阅读

get
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
ip
C++面试高频题

作者：守望者1028链接：https:www.nowcoder.comdiscuss55353来源：牛客网面试高频题：校招过程中参考过牛客诸位大佬的面经，但是具体哪一块是参考谁的我 ... [详细]

蜡笔小新 2024-12-25 12:32:36
ip
自己用过的一些比较有用的css3新属性【HTML】

web前端|html教程自己用过的一些比较用的css3新属性web前端-html教程css3刚推出不久，虽然大多数的css3属性在很多流行的浏览器中不支持，但我个人觉得还是要尽量开 ... [详细]

蜡笔小新 2024-12-24 19:26:54
ip
探索电路与系统的起源与发展

本文回顾了电路与系统的发展历程，从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明，还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]

蜡笔小新 2024-12-24 13:57:05
ip
最小路径覆盖与强连通分量的应用：国王的问题

本题探讨了在一个有向图中，如何根据特定规则将城市划分为若干个区域，使得每个区域内的城市之间能够相互到达，并且划分的区域数量最少。题目提供了时间限制和内存限制，要求在给定的城市和道路信息下，计算出最少需要划分的区域数量。 ... [详细]

蜡笔小新 2024-12-23 18:42:12
ip
帕斯卡三角形生成算法

给定行数 numRows，生成帕斯卡三角形的前 numRows 行。例如，当 numRows 为 5 时，返回的结果应为：[[1], [1, 1], [1, 2, 1], [1, 3, 3, 1], [1, 4, 6, 4, 1]]。 ... [详细]

蜡笔小新 2024-12-23 16:05:30
hash
深入解析Redis内存对象模型

本文详细介绍了Redis内存对象模型的关键知识点，包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析，帮助读者全面理解Redis内存管理机制。 ... [详细]

蜡笔小新 2024-12-23 14:50:23
ip
【48】在flask中使用ＳＱＬＡＬｃｈｅｍｙ连接ｓｑｌｉｔｅ数据库

方法：１　配置数据库basediros.path.abspath(os.path.dirname(__file__))　　＃获取当前文件的绝对路径appFlask(__name__ ... [详细]

蜡笔小新 2024-12-23 12:51:39
hash
深入理解HashCode与Equals方法

本文详细解析了Java中hashCode()和equals()方法的实现原理及其在哈希表结构中的应用，探讨了两者之间的关系及其实现时需要注意的问题。 ... [详细]

蜡笔小新 2024-12-23 02:59:15
rsa
采用IKE方式建立IPsec安全隧道

一、【组网和实验环境】按如上的接口ip先作配置，再作ipsec的相关配置，配置文本见文章最后本文实验采用的交换机是H3C模拟器，下载地址如 ... [详细]

蜡笔小新 2024-12-22 20:24:15
get
丽江客栈选择问题

本文介绍了一道经典的算法题，题目涉及在丽江河边的n家特色客栈中选择住宿方案。两位游客希望住在色调相同的两家客栈，并在晚上选择一家最低消费不超过p元的咖啡店小聚。我们将详细探讨如何计算满足条件的住宿方案总数。 ... [详细]

蜡笔小新 2024-12-22 20:15:25
get
CodeChef 2014 April Challenge - Chef的最终对决：数据结构与整体二分的应用

本题探讨了在大数据结构背景下，如何通过整体二分和CDQ分治等高级算法优化处理复杂的时间序列问题。题目设定包括节点数量、查询次数和权重限制，并详细分析了解决方案中的关键步骤。 ... [详细]

蜡笔小新 2024-12-22 19:34:39
get
解决C# Windows Forms客户端连接SignalR服务器时出现的错误

在尝试使用C# Windows Forms客户端通过SignalR连接到ASP.NET服务器时，遇到了内部服务器错误（500）。本文将详细探讨问题的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-21 16:55:52
get
深入解析 Android IPC 中的 Messenger 机制

本文详细介绍了 Android 中基于消息传递的进程间通信（IPC）机制——Messenger。通过实例和源码分析，帮助开发者更好地理解和使用这一高效的通信工具。 ... [详细]

蜡笔小新 2024-12-21 11:11:40
get
ListView简单使用

先上效果：主要实现了Listview的绑定和点击事件。项目资源结构如下：先创建一个动物类，用来装载数据：Animal类如下：packagecom.example.simplelis ... [详细]

蜡笔小新 2024-12-20 18:17:25

书苑幽香

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章