mmcls多标签分类实战（二）：resnet多标签分类

作者： | 来源：互联网 | 2023-10-17 07:43

上一章讲了如何制作数据集，接下来我们使用mmcls来实现多标签分类。

Config配置
mmcls是通过config来配置整个网络结构的。如下，我使用的是resnet18，因为数据中有5个属性，所以输出的num_classes=5。需要注意的是，head要选用head=dict(type=‘MultiLabelLinearClsHead’）。这是因为多标签分类，在进入loss前，应该用sigmoid激活，将pred的值归一化。如果使用softmax，会出现属性互斥的现象（因为pred在dim=1上，sum=1）。对于Multi-label问题，应该使用F.binary_cross_entropy_with_logits损失。

model = dict( type='ImageClassifier', backbone=dict( type='ResNet', depth=18, num_stages=4, out_indices=(3, ), style='pytorch'), neck=dict(type='GlobalAveragePooling'), head=dict( # type='LinearClsHead', type='MultiLabelLinearClsHead', num_classes=5, in_channels=512, # loss=dict(type='CrossEntropyLoss', loss_weight=1.0), # topk=(1, 5), ))

自定义dataset
为了读取数据，并将label转变为loss可以计算的格式，我们需要重新定 def load_annotations(self):为了不增加类，定义了self.multi_label的flag来分离Multi-label与Multi-class。我们在txt中的label是一个num，比如你有5个属性类别，label可能是1，3，而BCE中label需要的格式是[1,0,1]，因此我们需要转化一下。

def load_annotations(self): """Load image paths and gt_labels.""" if self.ann_file is None: samples = self._find_samples() elif isinstance(self.ann_file, str): lines = mmcv.list_from_file( self.ann_file, file_client_args=self.file_client_args) samples = [x.strip().rsplit(' ', 1) for x in lines] else: raise TypeError('ann_file must be a str or None') data_infos = [] for filename, gt_label in samples: info = {'img_prefix': self.data_prefix} info['img_info'] = {'filename': filename} temp_label = np.zeros(len(self.CLASSES)) if not self.multi_label: info['gt_label'] = np.array(gt_label, dtype=np.int64) else: ##multi-label classify if len(gt_label) == 1: temp_label[np.array(gt_label, dtype=np.int64)] = 1 info['gt_label'] = temp_label else: for i in range(np.array(gt_label.split(','), dtype=np.int64).shape[0]): temp_label[np.array(gt_label.split(','), dtype=np.int64)[i]] = 1 info['gt_label'] = temp_label data_infos.append(info) return data_infos

接下来就可以进行多标签的训练了。

推荐阅读

int
深入解析JDBC源码

本文详细探讨了JDBC（Java数据库连接）的内部机制，重点分析其作为服务提供者接口（SPI）框架的应用。通过类图和代码示例，展示了JDBC如何注册驱动程序、建立数据库连接以及执行SQL查询的过程。 ... [详细]

蜡笔小新 2024-12-25 19:59:15
int
Unity 客户端框架设计：UI管理系统的构建

本文详细介绍了如何构建一个高效的UI管理系统，集中处理UI页面的打开、关闭、层级管理和页面跳转等问题。通过UIManager统一管理外部切换逻辑，实现功能逻辑分散化和代码复用，支持多人协作开发。 ... [详细]

蜡笔小新 2024-12-27 10:28:40
int
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
int
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
int
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
int
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
int
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
int
深入解析 MVC 源码：ParameterDescriptor 与 Action 方法参数绑定

在前两篇文章中，我们探讨了 ControllerDescriptor 和 ActionDescriptor 这两个描述对象，分别对应控制器和操作方法。本文将基于 MVC3 源码进一步分析 ParameterDescriptor，即用于描述 Action 方法参数的对象，并详细介绍其工作原理。 ... [详细]

蜡笔小新 2024-12-27 15:26:10
int
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
int
解析Java中Text.splitText()方法及其应用场景

本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法，通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点，并保持在文档树中。 ... [详细]

蜡笔小新 2024-12-26 18:31:42
int
GDI基础介绍之几何绘图

使用GDI的一些AIP函数我们可以轻易的绘制出简 ... [详细]

蜡笔小新 2024-12-25 18:23:37
int
深入了解 Windows 窗体中的 SplitContainer 控件

SplitContainer 控件是 Windows 窗体中的一种复合控件，由两个可调整大小的面板和一个可移动的拆分条组成。本文将详细介绍其功能、属性以及如何通过编程方式创建复杂的用户界面。 ... [详细]

蜡笔小新 2024-12-25 17:20:08
int
实体映射最强工具类：MapStruct真香

实体映射最强工具类：MapStruct真香 ... [详细]

蜡笔小新 2024-12-25 16:22:17
int
魔兽世界：备战策略

本文探讨了《魔兽世界》中红蓝两方阵营在备战阶段的策略与实现方法，通过代码展示了双方如何根据资源和兵种特性进行战士生产。 ... [详细]

蜡笔小新 2024-12-25 19:03:01
int
CUGB图论专题：排水系统中的最大流问题 - EK与Dinic算法解析

本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率，使用经典的EK（Edmonds-Karp）和Dinic算法进行求解。 ... [详细]

蜡笔小新 2024-12-25 17:47:23

Tags | 热门标签

RankList | 热门文章