DeepLabV2论文理解

作者：韩铁衣 | 来源：互联网 | 2023-06-21 14:40

论文原文https:arxiv.orgpdf1606.00915.pdf介绍DeepLabV2是在DeepLab的基础上进行了改进，DeepLab论文请看&#x

论文原文

https://arxiv.org/pdf/1606.00915.pdf

介绍

DeepLabV2是在DeepLab的基础上进行了改进&＃xff0c;DeepLab论文请看&＃xff1a;https://blog.csdn.net/just_sort/article/details/95354212 。DeepLab使用了空洞卷积增大感受野&＃xff0c;CRF条件随机场细化结果&＃xff0c;多次度预测的3大Trick使得语义分割模型更加的Dense。而DeepLab V2在Deep Lab的基础上&＃xff0c;通过多尺度输入处理或者多孔空间金字塔池化&＃xff0c;可以更好的分割样本。

FCN改进

FCN进行语义分割时是用 $500×500500\times500$ 大小的图片&＃xff0c;在第一层卷积层conv1_1上使用了大小为100的padding&＃xff0c;最终在fc7层得到了一个 $16×1616\times16$ 的score map。这样的处理稍显粗糙&＃xff0c;FCN是第一层将CNN用到图像分割领域&＃xff0c;并且是端到端的&＃xff0c;在当时也取得了state-of-art的成绩。
DeepLab是将VGG网络的pool4和pool5层的步长由2改成1&＃xff0c;这样的改动使得vgg网络总的步长由原来的32变为8&＃xff0c;进而使得输入图像变为 $514×514514\times514$ &＃xff0c;正常padding时能得到 $67×6767\times67$ 的score map&＃xff0c;比FCN得到的要大很多。这种调整又使得要想继续使用vgg model进行fine tuning&＃xff0c;会导致感受野发生变化&＃xff0c;作者使用空洞卷积解决这个问题。

空洞卷积

在以前的标准卷积和pooling中&＃xff0c;一个filter中相邻的权重作用在feature map上的位置都是物理连续的。Kernel size表示卷积核的大小&＃xff0c;Stride表示滑动步长。现在为了保证感受野不发生变化。某一层的stride由2变成1后&＃xff0c;后面的层需要采用hole算法&＃xff0c;具体来说就是将连续的连接关系根据hole size变成跳连接的。即kernel size的大小虽然还是3&＃xff0c;但是这3个是经过hole size跳连接构成的。pool4的stride由2变成1&＃xff0c;则紧接着的conv5_1&＃xff0c;conv5_2和conv5_3中的hole size为2.接着pool5由2变成1&＃xff0c;则后面的fc6中hole size为4。
在这里插入图片描述

多孔金字塔池化

传统方法是把图像强行resize成相同的尺寸&＃xff0c;但是这样会导致某些特征扭曲或者消失&＃xff0c;这里联想到SIFT特征提取的时候用到过图像金字塔&＃xff0c;将图像放缩到不同的尺度&＃xff0c;再提取的SIFT特征点具有旋转&＃xff0c;平移不变性。因此这里也是借鉴这种方式使用空间金字塔的方法&＃xff0c;来实现对图像大小和不同长宽比的处理。这样产生的新的网络&＃xff0c;叫做SPP-Net&＃xff0c;可以不论图像的大小产生相同大小长度的表示特征。ASPP&＃xff08;多孔金字塔池化&＃xff09;就是通过不同的空洞卷积来对图像进行不同程度的缩放&＃xff0c;得到不同大小的输入特征图&＃xff0c;因为DeepLab的ASPP拥有不同rate的滤波器&＃xff0c;再把子窗口的特征进行池化就生成了固定长度的特征表示。之前需要固定大小的输入图像的原因是全连接层需要固定大小。现在将SPP层接到最后一个卷机后面&＃xff0c;SPP层池化特征并且产生固定大小的输出&＃xff0c;它的输出再送到全连接层&＃xff0c;这样就可以避免在网络的入口处就要求图像大小相同。
在这里插入图片描述

CRF

见&＃xff1a;https://blog.csdn.net/just_sort/article/details/95354212

实验结果

通过以下表格数据对比&＃xff0c;可以看到CRF 对准确率有较大提升。
通过以下表格数据对比&＃xff0c;可以看到较小的batch_size 能够更好的拟合模型&＃xff0c;虽然训练次数会增加&＃xff0c;因为小的batch_size 学习的过程比较缓慢&＃xff0c;迭代次数多一些。
通过以下表格数据对比&＃xff0c;可以看到ASPP 对于准确率提升是有贡献的。其中ASSP-L 的效果最好。
通过以下表格数据对比&＃xff0c;可以看到在ResNet-101 网络上的效果比在vgg16上的效果要更好一些&＃xff0c;可见VGG16 网络也不是万能的。

代码实现

https://github.com/SoonminHwang/caffe-segmentation/tree/master/prototxt

参考博客

https://blog.csdn.net/qq_36165459/article/details/78340094
https://zhuanlan.zhihu.com/p/54911894

推荐阅读

tree
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
default
解决Only fullscreen opaque activities can request orientation错误的方法

本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误，并提供了一种有效的解决方案。 ... [详细]

蜡笔小新 2024-11-13 09:46:25
include
[BZOJ2654] Tree 问题：二分查找与 Kruskal 算法结合的优化解决方案

题目《BZOJ2654: Tree》的时间限制为30秒，内存限制为512MB。该问题通过结合二分查找和Kruskal算法，提供了一种高效的优化解决方案。具体而言，利用二分查找缩小解的范围，再通过Kruskal算法构建最小生成树，从而在复杂度上实现了显著的优化。此方法不仅提高了算法的效率，还确保了在大规模数据集上的稳定性能。 ... [详细]

蜡笔小新 2024-11-11 18:19:28
web
优化后的标题：深入探讨网关安全：将微服务升级为OAuth2资源服务器的最佳实践

本文深入探讨了如何将微服务升级为OAuth2资源服务器，以订单服务为例，详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖，并配置Spring Security以实现对微服务的保护。通过这一过程，不仅增强了系统的安全性，还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践，包括如何配置OAuth2客户端和资源服务器，以及如何处理常见的安全问题和错误。 ... [详细]

蜡笔小新 2024-11-09 16:13:27
web
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
get
微信公众号推送模板40036问题

返回码错误码描述说明40001invalidcredential不合法的调用凭证40002invalidgrant_type不合法的grant_type40003invalidop ... [详细]

蜡笔小新 2024-11-12 16:31:32
get
Java swing 连连看小游戏开发小系统项目源代码实训实验毕设

Javaswing连连看小游戏开发小系统项目源代码实训实验能满足学习和二次开发可以作为初学者熟悉Java的学习，作为老师阶段性学习的一个成功检验不再是单调的理解老师空泛的知识，导入 ... [详细]

蜡笔小新 2024-11-12 10:14:33
uml
Go语言中的命令设计模式详解

命令模式是一种行为设计模式，它将请求封装成一个独立的对象，从而允许你参数化不同的请求、队列请求或者记录请求日志。本文将详细介绍命令模式的基本概念、组件及其在实际场景中的应用。 ... [详细]

蜡笔小新 2024-11-12 09:26:59
web
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
web
大型网站技术架构：核心原理与案例分析的思维导图解析

本文通过思维导图的形式，深入解析了大型网站技术架构的核心原理与实际案例。首先，探讨了大型网站架构的演化过程，从单体应用到分布式系统的转变，以及各阶段的关键技术和挑战。接着，详细分析了常见的大型网站架构模式，包括负载均衡、缓存机制、数据库设计等，并结合具体案例进行说明。这些内容不仅有助于理解大型网站的技术实现，还能为实际项目提供宝贵的参考。 ... [详细]

蜡笔小新 2024-11-11 16:13:07
object
Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨

在《Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨》中，详细介绍了Cocos2d-x的基础概念，并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解，例如在处理鱼的运动过程中，可以通过编写自定义函数来动态计算角度变化，利用CallFunc回调机制实现高效的游戏逻辑控制。此外，文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏，为开发者提供了实用的编程技巧和最佳实践。 ... [详细]

蜡笔小新 2024-11-11 14:49:31
get
清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期）

清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期） ... [详细]

蜡笔小新 2024-11-07 13:30:09
get
哈希冲突实例分析与解决方案探讨

本文通过具体实例详细分析了哈希冲突的原因及其潜在影响，并探讨了多种有效的解决策略。研究不仅涵盖了MD5等常用哈希算法的局限性，还提出了基于哈希表扩展、双哈希技术和布隆过滤器等方法的综合解决方案，以提高数据处理的可靠性和效率。 ... [详细]

蜡笔小新 2024-11-06 14:49:14
get
批量将多张图片转换为PDF或PPT文件

本文介绍了如何批量将多张图片转换为PDF或PPT文件的方法。首先，可以通过批量下载工具或脚本高效地获取大量图片。接着，利用专业的图像处理软件或在线服务，将这些图片统一转换为所需的PDF或PPT格式，确保文件质量和一致性。此外，文中还提供了手动抓取单张图片进行初步测试的建议，以验证转换效果。 ... [详细]

蜡笔小新 2024-11-05 17:31:58
get
Python 实战：异步爬虫（协程技术）与分布式爬虫（多进程应用）深入解析

本文将深入探讨 Python 异步爬虫和分布式爬虫的技术细节，重点介绍协程技术和多进程应用在爬虫开发中的实际应用。通过对比多进程和协程的工作原理，帮助读者理解两者在性能和资源利用上的差异，从而在实际项目中做出更合适的选择。文章还将结合具体案例，展示如何高效地实现异步和分布式爬虫，以提升数据抓取的效率和稳定性。 ... [详细]

蜡笔小新 2024-11-05 14:12:56

韩铁衣

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章