RetinafaceONNX如何正确导出

作者：吴为36 | 来源：互联网 | 2023-08-27 18:42

Retinaface是一个人脸检测器，人脸检测天生存在强先验知识，比如近场人脸识别，人脸较大，监控视角下人脸识别通常人脸较小，两者天生对输入的分辨率有个假设，如果人脸很大，不需要大

Retinaface 是一个人脸检测器，人脸检测天生存在强先验知识，比如近场人脸识别，人脸较大，监控视角下人脸识别通常人脸较小，两者天生对输入的分辨率有个假设，如果人脸很大，不需要大的分辨率，提升速度。人脸小，希望提高 Recall 那么需要大的分辨率。Retinaface 在不同分辨率下怎么做这件事情。怎么通过这个仓库的方案解决该问题。

https://github.com/biubug6/Pytorch_Retinaface

直接执行 convert_to_onnx.py

python convert_to_onnx.py

报错：找不到 './weights/mobilenetV1X0.25_pretrain.tar'

该权重是在 ImageNet 下预训练的模型，ImageNet 的预训练模型喜欢 tar 结尾。

解决：打开 data/config.py

# 修改为 False 'pretrain': False,

然后执行：

python convert_to_onnx.py

又报错：找不到 './weights/mobilenet0.25_Final.pth'

解决：去github 仓库下载该模型，建个weights 文件夹，放到里面。

然后执行：

python convert_to_onnx.py

成功！

使用 Netron 观察 onnx 模型，

老版本与老版本区别：

1. 使用的上采样为 upsample, 并且又警告提示

2. 有很多的 shape 引用（主要是输出头那里），产生了 gather 等节点

3. 输出有三个，借鉴 yolov5 做法，三个拼接为一个，后处理代码会简化。

问题1解决方案：

drawing

观察到：点击输出节点 output0 ： opset =9（我的是 opset = 13）。opset=13会输出多个如下警告（opset_version = 11 可以解决该问题）：

WARNING: The shape inference of prim::Constant type is missing, so it may result in wrong shape inference for the exported graph. Please consider adding it in symbolic function.

原则1：

使用 opset_version = 11 ，不要低于 11

问题1解决：一般我们需要 opset=11 或者更高版本。convert_to_onnx.py：

torch_out = torch.onnx._export(net, inputs, output_onnx, export_params=True, verbose=False, input_names=input_names, output_names=output_names, opset_version = 11 )

opset=11或更高影响 upsample，会将其变为 resize。opset_version = 11解决了上面的警告。

但是还是有 shape 引用。点击 resize 节点：

drawing

观察到 scales 是空的，使用的是 sizes。引用了上面 sizes 的大小，所以引用sizes 就需要引用上一级的 shape 来计算 sizes 得到结果。

原则2：

对于 nn.upsample 或 nn.functional.interpolate 函数，使用 scale_factor 指定倍率，而不是使用 size 参数指定大小。

解决：models/net.py：

# up3 = F.interpolate(output3, size=[output2.size(2), output2.size(3)], mode="nearest") up3 = F.interpolate(output3, scale_factor=2, mode="nearest") # up2 = F.interpolate(output2, size=[output1.size(2), output1.size(3)], mode="nearest") up2 = F.interpolate(output2, scale_factor=2, mode="nearest")

再次导出。

然后观察到，与 yolov5 一样，使用 scales ：1,1,2,2。shape 引用也被干掉。

drawing

节点如下：

drawing

问题2 解决方案

观察到：

drawing

原则3：

对于任何用到 shape、size返回值的参数时，例如： tensor.view(tensor.size(0), -1) 这类操作，避免直接使用 tensor.size 的返回值，而是加上 int 转换，tensor.view(int(tensor.size(0)), -1)

修改代码： models/retinaface.py 主要是修改三个 head，如下：

# return out.view(out.shape[0], -1, 2) return out.view(int(out.shape[0]), -1, 2) # return out.view(out.shape[0], -1, 4) return out.view(int(out.shape[0]), -1, 4) # return out.view(out.shape[0], -1, 10) return out.view(int(out.shape[0]), -1, 10)

结果：

drawing

点击 reshape 节点，发现：

drawing

原则4：

对于 reshape、view 操作时， -1 放到 batch 维度。其他维度可以计算得到。batch 维度禁止指定大于 -1 的明确数字。

# [1, 40, 40, 4] -> [-1, ?, 2] # ? = 40 * 40 * 2 与与 yolov5 中 3 * 80 * 80 是一样的，2 这里指的是 anchor 的数量为2。 # print(f"**************{out.shape}") # return out.view(out.shape[0], -1, 2) # return out.view(int(out.shape[0]), -1, 2) return out.view(-1, int(out.shape[1] * out.shape[2] * 2), 2) # return out.view(int(out.shape[0]), -1, 4) return out.view(-1, int(out.shape[1] * out.shape[2] * 2), 4) # return out.view(int(out.shape[0]), -1, 10) return out.view(-1, int(out.shape[1] * out.shape[2] * 2), 10)

点击 reshape，看到：

drawing

问题3 解决方案

定义顺序：xywh,negative, positive, landmark(10)

if self.phase == 'train': output = (bbox_regressions, classifications, ldm_regressions) else: output = (bbox_regressions, F.softmax(classifications, dim=-1), ldm_regressions) return output

推理时候多加一个 F.softmax(classifications, dim=-1)，因为训练时候使用的是 layers/modules/multibox_loss.py：

loss_c = F.cross_entropy(conf_p, targets_weighted, reduction='sum') # F.Cross_entropy(input, target)函数中包含了softmax 和 log 的操作，即网络计算送入的input参数不需要进行这两个操作。

因此推理时候，需要额外加 F.softmax。一般我们原则是尽量把操作放到onnx 中，让onnx 来优化运算。但是，softmax 可以被优化，减少计算量，参考：https://blog.csdn.net/hymn1993/article/details/124093421

所以，我们去掉 softmax，选择在 C++ 代码中进行优化加快推理速度。

models/retinaface.py：

return torch.cat((bbox_regressions, classifications, ldm_regressions), dim = -1) # if self.phase == 'train': # output = (bbox_regressions, classifications, ldm_regressions) # else: # output = (bbox_regressions, F.softmax(classifications, dim=-1), ldm_regressions) # return output

drawing

自此， Retinaface 的模型导出就全部完成了。至于 C++ 推理部分和如何设置动态宽高推理，有时间我会更新。

推荐阅读

utf-8
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
const
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
ip
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
client
mmcls多标签分类实战（二）：resnet多标签分类

上一章讲了如何制作数据集，接下来我们使用mmcls来实现多标签分类。 ... [详细]

蜡笔小新 2023-10-17 07:43:01
client
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
php
lua语言闭包、模式匹配、日期、编译、模块的特性及应用

本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值，函数可以作为变量自由传递，也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性，为程序开发带来了便利。 ... [详细]

蜡笔小新 2023-12-14 18:18:21
ip
Android 新闻App的本地服务器搭建教程

本文介绍了在开发Android新闻App时，搭建本地服务器的步骤。通过使用XAMPP软件，可以一键式搭建起开发环境，包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表，并设置相应的属性。最后，给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]

蜡笔小新 2023-12-14 17:15:19
ip
Python如何调用类里面的方法

本文介绍了在Python中调用同一个类中的方法需要加上self参数，并且规范写法要求每个函数的第一个参数都为self。同时还介绍了如何调用另一个类中的方法。详细内容请阅读剩余部分。 ... [详细]

蜡笔小新 2023-12-14 12:52:55
const
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
const
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
ip
CentOS安装Python2.7.2的步骤和注意事项

本文介绍了在CentOS上安装Python2.7.2的详细步骤，包括下载、解压、编译和安装等操作。同时提供了一些注意事项，以及测试安装是否成功的方法。 ... [详细]

蜡笔小新 2023-12-12 13:54:31
ip
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
ip
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58
get
都会|可能会_###haohaohao###图神经网络之神器——PyTorch Geometric 上手 & 实战

篇首语：本文由编程笔记#小编为大家整理，主要介绍了###haohaohao###图神经网络之神器——PyTorchGeometric上手&实战相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 18:30:35
get
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31

吴为36

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章