当前位置: 开发笔记 > 编程语言 > 正文

从YOLOv4看模型优化方法

作者：yangxinhui2602905795 | 来源：互联网 | 2023-09-06 15:31

YOLOv4中相关优化方法1.Bagoffreebies（增加训练时间，不影响推理速度下提升性能）1.1数据增强：亮度、

YOLOv4中相关优化方法

1.Bag of freebies&＃xff08;增加训练时间&＃xff0c;不影响推理速度下提升性能&＃xff09;

1.1 数据增强&＃xff1a;

亮度、对比度、色调、饱和度、噪音等
随机缩放、裁剪、翻转、旋转等
模拟遮挡
- random erase or CutOut: 随机将图像中的矩形区域随机填充像素值或置零
- MixUp&＃xff1a;将两张图像按照一定比例因子进行叠加融合&＃xff0c;该比例因子服从B分布。融合后的label包含两张图像的所有标签。
- CutMix&＃xff1a;从一张图中crop一块矩形图像到另一张图中&＃xff0c;对应融合后图像的label也要进行更新。
- 风格迁移GAN&＃xff1a;通过GAN的方式扩增数据量
feature map层面的增强
- DropOut&＃xff1a;
  - 原理&＃xff1a;前向传播的时候&＃xff0c;让某个神经元的激活值以一定的概率1-p停止工作&＃xff08;输出值清0&＃xff09;&＃xff0c;bp更新权值时&＃xff0c;不再更新与该节点相连的权值。
  - 作用&＃xff1a;解决因参数过多导致的过拟合&＃xff0c;多用于全连接层。
- DropConnect&＃xff1a;
  - 原理&＃xff1a;输出节点中将每个与其相连的输入权值以1-p的概率清0&＃xff08;模型权重清零&＃xff09;,DorpConnect为DorpOut的改进
  - dropout与dropconnect如下图&＃xff1a;
- 作用&＃xff1a;针对卷积层正则化。

1.2 解决语义分布差异&＃xff08;类别不平衡&＃xff09;

Two Stage检测使用&＃xff1a;
- OHEM&＃xff1a;
  - 优点&＃xff1a;
    - 对于数据的类别不平衡问题不需要采用设置正负样本比例的方式来解决&＃xff0c;这种在线选择方式针对性更强
    - 当数据集增大&＃xff0c;算法可以在原来基础上提升更大
  - 核心&＃xff1a;核心是选择一些hard example作为训练的样本从而改善网络参数效果&＃xff0c;hard example指的是有多样性和高损失的样本
  - 原理&＃xff1a;&＃xff08;基于fast rcnn改进&＃xff09;hard example是根据每个ROI的损失来选择的&＃xff0c;选择损失最大的一些ROI。首先&＃xff0c;ROI经过ROI plooling层生成feature map&＃xff0c;然后进入只读的ROI network得到所有ROI的loss&＃xff1b;然后根据损失排序选出hard example&＃xff0c;并把这些hard example作为下面那个ROI network&＃xff08;从图中可知两个RoI Network是参数共享的&＃xff09;的输入进行训练。下面为OHEM原理图&＃xff1a;
- RFB-Net
  - 背景&＃xff1a;在one stage检测中尽可能地增加backbone感受野
  - 原理&＃xff1a;借鉴了inception结构的并行结构&＃xff0c;并对不同大小卷积核后加上不同空洞率的空洞卷积(卷积核为kxk&＃xff0c;空洞率为k)&＃xff08;作者认为这样做对kernels的大小和离心率之间的关系进行了建模&＃xff09;
  - 图示
ASFF(自适应尺度融合)
- 原理&＃xff1a;首先通过FPN产生level1-level3不同尺度的特征图&＃xff0c;作者使用ASFF&＃xff08;adaptively spatial feature fusion&＃xff09;思想进行融合&＃xff0c;思想就是level1-level3个尺度图分别再融合成3个对应尺度的特征图&＃xff0c;融合的权重自适应调整。拿ASFF-1作为例子&＃xff0c;首先将3个尺度的图都resize到level1尺度大小&＃xff0c;然后学习一个融合权重(使用softmax 做不同feature map加权)&＃xff0c;这样可以更好地学习不同特征尺度对于预测特征图的贡献。
- 原理图
BiFPN模块–来自EfﬁcientDet
- 模块结构&＃xff1a;BiFPN是对PANet的改动&＃xff0c;提出了三个优化
  - 删掉那些只有一个输入边的节点&＃xff0c;因为只有一个输入边的节点就没有特征融合&＃xff0c;对特征网络的贡献少
  - 添加了从原始输入到输出节点的边&＃xff08;同一级别的输入输出&＃xff09;
  - 把双向路径看作是一个特征网络层&＃xff0c;就可以多次重复特征层得到更多的特征融合。&＃xff08;就是图中f子图&＃xff0c;可以把f图当作一个层&＃xff0c;可以多次重复&＃xff0c;前一层的5个输出&＃xff08;
    - 特点:Swish函数可以看做是介于线性函数与ReLU函数之间的平滑函数,模型效果优于ReLU
  - Hard-Swish
    - 公式:
      $h−swish(x)&＃61;x∗ReLU6(x&＃43;3)6h-swish(x)&＃61;x*\frac{ReLU6(x&＃43;3)}{6}$
    - 曲线:
    - 特点:针对量化模式下对Swish的改进(Sigmoid比ReLU6耗时),使用ReLU6替换sigmoid
  - Mish:
    - 公式:
    $Mish&＃61; x*tanh(ln(1&＃43;e^x))$
    - 曲线:
    - 特点:Mish激活函数比ReLU等激活函数更加平滑,训练更稳定精度有提升,有望替换ReLU,只是计算更复杂.
  2.5 后处理(anchor free无)
  - NMS
  - soft NMS:
    - 特点: 对于重叠框中除置信度最高的框外,将其余框的置信度用稍低一点的置信度来代替原有置信度&＃xff0c;而不是像NMS直接将iou超过阈值的框置信度置零.这种方式可以有效地增加重叠目标的召回.具体如何降低置信度的方式如下图公式:
  - DIoU NMS:
    - 特点: 基于soft NMS进行改进.将bbox中心点之间的距离信息考虑到置信度更新中来,将中心点距离信息作为soft NMS公式的偏执项.

推荐阅读

go
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
hash
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
hash
技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告

技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]

蜡笔小新 2024-11-07 14:33:19
text
探索聚类分析中的K-Means与DBSCAN算法及其应用

聚类分析是一种用于解决样本或特征分类问题的统计分析方法，也是数据挖掘领域的重要算法之一。本文主要探讨了K-Means和DBSCAN两种聚类算法的原理及其应用场景。K-Means算法通过迭代优化簇中心来实现数据点的划分，适用于球形分布的数据集；而DBSCAN算法则基于密度进行聚类，能够有效识别任意形状的簇，并且对噪声数据具有较好的鲁棒性。通过对这两种算法的对比分析，本文旨在为实际应用中选择合适的聚类方法提供参考。 ... [详细]

蜡笔小新 2024-11-04 13:20:39
string
Python AlphaShape：基于点集估算图像区域的Alpha形状算法解析

本文探讨了基于点集估算图像区域的Alpha形状算法在Python中的应用。通过改进传统的Delaunay三角剖分方法，该算法能够生成更加灵活和精确的形状轮廓，避免了单纯使用Delaunay三角剖分时可能出现的过大三角形问题。这种“模糊Delaunay三角剖分”技术不仅提高了形状的准确性，还增强了对复杂图像区域的适应能力。 ... [详细]

蜡笔小新 2024-11-03 17:11:41
go
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
hash
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
string
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
go
杜甫《喜晴》的两种英译比较

本文对比了杜甫《喜晴》的两种英文翻译版本：a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑，b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ... [详细]

蜡笔小新 2024-11-12 15:02:28
string
poj 3352 Road Construction

poj 3352 Road Construction ... [详细]

蜡笔小新 2024-11-12 11:24:39
go
Pandas 散点图矩阵（scatter_matrix）绘图功能及其参数详解

通过使用 `pandas` 库中的 `scatter_matrix` 函数，可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵，还能通过参数如 `frame`、`alpha`、`c`、`figsize` 和 `ax` 等进行自定义设置，以满足不同的可视化需求。此外，`diagonal` 参数允许用户选择对角线上的图表类型，例如直方图或密度图，从而提供更多的数据洞察。 ... [详细]

蜡笔小新 2024-11-09 12:03:42
go
2018 HDU 多校联合第五场 G题：Glad You Game（线段树优化解法）

题目链接：http://acm.hdu.edu.cn/showproblem.php?pid=6356在《Glad You Game》中，Steve 面临一个复杂的区间操作问题。该题可以通过线段树进行高效优化。具体来说，线段树能够快速处理区间更新和查询操作，从而大大提高了算法的效率。本文详细介绍了线段树的构建和维护方法，并给出了具体的代码实现，帮助读者更好地理解和应用这一数据结构。 ... [详细]

蜡笔小新 2024-11-08 19:17:23
go
如何在C#中配置组合框的背景颜色？

如何在C#中配置组合框的背景颜色？ ... [详细]

蜡笔小新 2024-11-08 13:06:59
join
使用JavaScript生成Java兼容的UUID代码实现与优化技巧

本文介绍了UUID（通用唯一标识符）的概念及其在JavaScript中生成Java兼容UUID的代码实现与优化技巧。UUID是一个128位的唯一标识符，广泛应用于分布式系统中以确保唯一性。文章详细探讨了如何利用JavaScript生成符合Java标准的UUID，并提供了多种优化方法，以提高生成效率和兼容性。 ... [详细]

蜡笔小新 2024-11-05 18:19:54
function
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36

yangxinhui2602905795

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

从YOLOv4看模型优化方法

YOLOv4中相关优化方法

1.Bag of freebies&＃xff08;增加训练时间&＃xff0c;不影响推理速度下提升性能&＃xff09;

1.1 数据增强&＃xff1a;

1.2 解决语义分布差异&＃xff08;类别不平衡&＃xff09;

2.5 后处理(anchor free无)