热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【论文阅读】ContextawareCrosslevelFusionNetworkforCamouflagedObjectDetection(IJCAI2021)

论文题目:Context-awareCross-levelFusionNetworkforCamouflflagedObjectDetection论文地址ÿ

论文题目:Context-aware Cross-level Fusion Network for Camouflflaged Object Detection

论文地址:https://arxiv.org/pdf/2105.12555.pdf

代码地址:https://github.com/thograce/C2FNet

 

文章贡献:

1. 提出了一个新的伪装目标检测模型C2F-Net,它整合了跨层特征,并考虑了丰富的全局上下文信息;

2. 提出了一个上下文感知模块DGCM,该模块可从融合的特征中获取全局上下文信息;

3. 提出了一个有效的融合模块ACFM集成跨层特征,该模块将特征与MSCA提供的有价值的注意线索集成在一起。

 


1 背景与动机

论文解决的是伪装目标检测(camouflflaged object detection,COD)的问题。由于伪装,物体和周围环境之间的边界对比度非常低,从而导致难以准确识别:

 


2 方法框架


总体架构


使用Res2Net50来获取5个stage的特征,对高维度特征E3\E4\E5使用接收域块(receptive fifield block,RFB)来扩展接收域,捕获更丰富的特征。

之后将E4和E5经过RFB后的结果输入注意诱导的跨级融合模块(Attention-induced Cross-level Fusion Module ,ACFM)集成多尺度特征,再经过双分支全局上下文模块(Dual-branch Global Context Module ,DGCM)来获取上下文信息。同样的,对E3经过RFB后的结果也经过上述处理,最终得到预测结果。

其中,RFB的结构如下,输出Y的通道数为64:

 


ACFM

由于相同的目标物体可能由于拍摄原因在图像中存在大小不同的问题,因此论文提出ACFM来集成多尺度特征。

对输入的2个特征Fa和Fb,将Fb上采样到与Fa相同的大小,进行相加的操作获得融合了不同尺度特征的总特征xy。将xy输入MSCA模块,获得输出结果wei,wei和wei的反向分别与Fa和上采样的Fb相乘,再将这两者相加,得到xo。最后xo经过3x3卷积,得到最终的输出特征F。

其中MSCA(Multi-Scale Channel Attention)的结构如下:

对输入的特征X经过一个双分支结构,分支1是局部注意分支,由1x1卷积+BN+ReLU+1x1卷积+BN组成。分支2是全局注意分支,由全局池化+1x1卷积+BN+ReLU+1x1卷积+BN组成。最后将双分支的结果经过加总,在经过sigmoid函数,得到输出特征W。

 


DGCM

全局上下文信息是提高伪装目标检测性能的关键,因此论文提出DGCM模块来获取上下文信息。

输入特征F经过两个分支,分支1对F进行3x3卷积操作得到Fc(CxHxW),再将Fc和Fc经过MSCA模块后的输入相乘,得到Fcm。分支2对F进行池化+3X3卷积操作得到Fp(CxW/2xH/2),跟Fc进行同样的操作后得到Fpm。之后将Fpm进行上采样并与Fcm相加,经过3x3卷积,加上特征F后再次经过3x3卷积,最终得到输出特征F'。

 


损失函数

使用加权二值交叉熵损失和加权IoU损失。

 


3 实验结果


数据集


  1. CHAMELEON,包含76张伪装图像;
  2. CAMO,1.25k图像,共8个类别;
  3. COD10K,共5066张图像,包含5个大类和69个子类。

评价指标 


  1. MAE,评估归一化后的pred和GT之间的平均像素级相对误差;
  2. 加权F-measure,考虑加权精度和加权查全率的综合性能测度;
  3. S-measure,计算pred与GT之间的对象感知和区域感知结构相似性;
  4. E-measure,基于人类视觉感知机制来评估COD的整体和局部准确性。

 

与先进方法的比较:

各模块消融实验:

MSCA消融实验,第一列表示使用卷积操作替换MSCA模块:


推荐阅读
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文介绍了Android 7的学习笔记总结,包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容,并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同,否则会出现问题。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • Final关键字的含义及用法详解
    本文详细介绍了Java中final关键字的含义和用法。final关键字可以修饰非抽象类、非抽象类成员方法和变量。final类不能被继承,final类中的方法默认是final的。final方法不能被子类的方法覆盖,但可以被继承。final成员变量表示常量,只能被赋值一次,赋值后值不再改变。文章还讨论了final类和final方法的应用场景,以及使用final方法的两个原因:锁定方法防止修改和提高执行效率。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 【Windows】实现微信双开或多开的方法及步骤详解
    本文介绍了在Windows系统下实现微信双开或多开的方法,通过安装微信电脑版、复制微信程序启动路径、修改文本文件为bat文件等步骤,实现同时登录两个或多个微信的效果。相比于使用虚拟机的方法,本方法更简单易行,适用于任何电脑,并且不会消耗过多系统资源。详细步骤和原理解释请参考本文内容。 ... [详细]
  • ZSI.generate.Wsdl2PythonError: unsupported local simpleType restriction ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • 闭包一直是Java社区中争论不断的话题,很多语言都支持闭包这个语言特性,闭包定义了一个依赖于外部环境的自由变量的函数,这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例,介绍了闭包的定义和特性。 ... [详细]
  • MongoDB用户验证auth的权限设置及角色说明
    本文介绍了MongoDB用户验证auth的权限设置,包括readAnyDatabase、readWriteAnyDatabase、userAdminAnyDatabase、dbAdminAnyDatabase、cluster相关的权限以及root权限等角色的说明和使用方法。 ... [详细]
author-avatar
叫我GYJ
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有