热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PatchMapBasedHybridLearningDehazeNetforSingleImageHazeRemoval(基于PatchMap的去雾网络,IEEE2020)

摘要:在雾霾环境中获取的图像通常存在能见度差和信息丢失的问题。因此,在本研究中,我们提出了一种基于patch-map的混合学习去雾网络&#

摘要:在雾霾环境中获取的图像通常存在能见度差和信息丢失的问题。因此,在本研究中,我们提出了一种基于patch-map的混合学习去雾网络,通过使用一种包含patch-map和双注意生成对抗网络的混合学习技术,将这两种学习策略结合起来。在这种方法中,分析了限制暗通道先验(DCP)性能的原因。定义了一种新的特征patch map,用于自适应地选择patch大小。可以有效地解决DCP的局限性(例如,颜色失真和无法恢复涉及白色场景的图像)。此外,为了进一步提高该方法的除霾性能,我们将基于patch-map的DCP嵌入到网络中,该模块与大气光发生器、patch map 选择模块和精细化模块同时进行训练。将传统方法与基于学习的方法相结合,可以有效地提高网络的雾霾去除性能。实验结果表明,与其他最先进的去雾算法相比,该方法可以获得更好的重建结果。

1.主要贡献

据我们所知,所提出的架构是第一个采用patch map的雾霾去除算法,并将基于学习和基于先验的方法集成到一个单一的网络中。实验结果表明,该方法不仅能解决颜色失真问题,而且能显著提高去雾效果的质量。1)设计了一种端到端的去雾系统PMHLD,该系统将基于patch-map的DCP集成到网络中。利用patch map,可以将整个网络与估算的大气光、patch map、精细化网络联合训练,恢复图像。实验结果表明,与原PMS-Net相比,所提出的PMHLD技术具有更好的图像恢复性能。2)针对DCP中存在的颜色失真问题,研究了DCP在某些场景下失败以及使用固定的patch大小导致性能不佳的原因。一个新的特征叫做patch map被提出。使用这个新特性,可以为每个像素自适应地选择patch大小。3)为了有效地预测斑块图,提出了一种基于双注意GAN和激活函数的patch map选择网络。利用这两个模块,可以有效地改进patch map的预测。4)为了实现混合学习,将DCP嵌入到学习过程中,提出了基于patch-map的暗通道层,该暗通道层具有可学习的patch map。利用该层,可以将传统的暗通道操作和基于patch-map的暗通道操作集成到网络学习中。

2.去雾模型

该网络的流程图如图3所示。该网络基于两种去雾策略,即基于patch-map的DCP和混合学习的DehazeNet。它的结构可分为两部分,即无雾图像发生器和无雾图像鉴别器。在发生器部分,透射图和大气光是两个需要估计的关键变量。对于传输图的预测,选择DCP作为骨干,因为与其他基于人工预处理的去雾方法相比,DCP具有优异的性能。然而,使用DCP恢复的结果通常会出现严重的颜色失真问题。因此,需要分析造成这种颜色畸变的原因。为了解决这个问题,一个叫做patch map的新特性被提出。为了准确地生成补丁图,设计了一种双注意的补丁图选择网络。对于除雾的另一个重要变量大气光的估计,我们开发了一个估计网络来精确地预测它。对于无雾鉴别器部分,由于我们希望得到的重构结果尽可能接近清晰的图像,所以我们采用了鉴别器体系结构。

图3 提出的雾霾去除算法的流程图 

2.1 Patch Map

我们描述了为学习过程生成一个补丁图(PM)的过程。在训练阶段,首先根据(7)和式(8)采用不同的patch大小恢复输入的雾蒙蒙的图像。

其中I(x) 和A是朦胧图像和大气光。ti(x) 和Ji(x),分别为不同patch size i下DCP估计的传输图和无雾图像。然后,计算去雾结果与地面真值之间的误差函数 。

其中Ei(x)为误差函数,Jgth(x)为基真值。对于每个像素的不同patch size i,将计算误差函数。下一步,通过搜索每个像素的误差函数最小的patch大小来定义patch map的真实值。 

 其中PM(x)为ground-truth patch map, k为x位置的patch map值,最大patch size n设为120。从这个操作中,可以计算出所有图像的ground-truth patch map用于训练过程。

在一般情况下,在白色、灰色、明亮和天空区域,patch的大小最好更大一些,以适应DCP。在暗色区域或只有一个或两个颜色分量的区域,斑块尺寸最好小一些。在明亮区域,patch的大小可能会发生变化,因为patch的大小需要适当调整以达到0的值。对于深度差异较大的区域,patch大小可能较小。此外,地区类似的颜色并不总是有相同的块大小,随着补丁地图会改变根据相邻像素。因此,从上面的分析中,可以知道补丁地图是一个复杂的特性,是很难计算的。

2.2 双注意的PM选择网络

为了准确预测patch map,提出了BAPMS-Net自适应选择patch size。该网络的设计如图6所示。该网络由两个子网组成,即补丁图生成器和补丁图鉴别器。在补丁图生成器中,设计了注意模块和编码器-解码器体系结构,以提高补丁图生成的性能。此外,为了提高训练过程和网络的性能,在分析数据分布的基础上,提出了一种新的激活函数,即patch map ReLU (PMReLU)。

图6 BAPMS-Net 

2.2.1 注意力模块

利用注意地图对网络中重要区域进行关注的研究成果,采用了注意模块Attention_G来提高patch map生成的性能,如图8(a)所示。Attention_G的思想是:在传统的DCP中,对于具有高强度差和深度差的区域,patch的选择对恢复的图像质量非常敏感。对于高强度的部分,颜色失真问题是由于patch大小选择错误造成的。此外,对于深度差较大的区域,如果patch大小选择错误,通常会出现晕轮伪影。因此,通过结合强度差和深度差信息,注意力地图可以让网络聚焦于重要区域。

2.2.2 Patch Map Generator

该补丁地图生成器的体系结构可分为编码器和解码器两部分。在网络的开始,将输入的图像乘以Attention_G,并与3×3内核进行卷积,将信息投影到更高维度的空间中。然后将结果传递给所提出的多尺度u模块提取图像特征。多尺度u模块的结构由两个不同的块组成,即多尺度wresblock (MWRB)和多尺度反褶积块(MDB),如图7所示。在MWRB的情况下,采用Wide-ResNet (WRN)[36]作为骨干。在每个块中,采用多尺度技术提取不同尺度的信息。利用多级策略来获得更好的特征提取性能。在提出的网络中,我们应用这个策略来生成patch map,因为我们认为这些提取的特征与雾霾有关。为了进一步提高提取不同层次特征的能力,采用了金字塔连接样式。具体来说,在第一个块中,大小为5×5, 3×3和1×1的三个卷积核并行连接,因为可以保存不同尺度的大量信息。在第二和第三块中分别应用大小(3×3, 1×1)和(1×1)的卷积核。此外,为了保留前一层的上下文信息,提出了多级池(multipooling)。

式中,x表示从上一MWRB层确定的特征,Cke()表示核大小为e的stride卷积运算,扩展级别为k, ||表示串联运算,s是stride卷积的尺度范围,s∈{2,3,5}。在这项工作中,k被设为2。

利用多池操作,提取的特征可以在不同的接受大小和规模下保持不变。对于多尺度u模块的另一部分,应用多尺度反褶积块(multiscale - deconvolution Block, MDB)对多尺度u模块的信息进行组合。这是因为反褶积运算可以帮助网络重构输入数据[38]的形状信息,而patch的大小与该形状信息有关。在补丁图生成器的其余部分中,来自MWRB和MDB的输出被连接起来。该信息将被输入到下一个MDB和更高层的解码器中。解码器的设计由全局卷积网络模块(GCN)和边界细化模块(BR)组成,以保留高分辨率数据和边缘细节。然后将feature map馈入高档层,采用密集连接的风格对提取的信息进行合并。 

图7 多尺度w - resblock和多尺度反褶积块的结构。

2.2.3 Patch Map ReLU

在训练过程中,激活函数非常重要,它可以大大提高网络的收敛速度,提高网络的性能。例如,在之前的研究中,提出了BReLU,根据传输图的性质来预测传输图。一般来说,激活函数的候选函数通常是Sigmoid或ReLU。但是,这些激活函数在最后一层可能存在梯度消失(即零梯度)和响应溢出的问题。此外,在某些特定场景中,这些功能可能与数据的分布不匹配。因此,在BAPMS-Net的设计中,为了加快收敛速度,提高网络性能,通过分析数据分布,提出了patch map ReLU (PMReLU)。在学习过程中,PMReLU在式12中定义,其可视化表示如图9所示。 

 

 图9

2.2.4 Bi-Attentive Patch Map Discriminator

使用鉴别器的目的是通过验证输出图像来帮助生成器学习真实的结果。提出了双注意map(Attention_D))来进一步提高鉴别器的性能。在使用该map时,将朦胧图像和预测的patch map拼接在一起,并将拼接后的信息与生成器的注意图(即Attention_G)相乘,以及由估计的patch map与ground truth之间的差值计算得到的误差图。

2.2.5 Loss Function

如图6所示,在我们的patch map生成器中存在两种损耗:patch map的损耗和attention map的损耗。在BAPMS-Net中,发生器的损耗函数为

其中LG_B APMS−Net为BAPMS-Net的生成损失,Lpm为预测注意图与地面真实注意图之间的均方误差(MSE), Latt为预测注意图与地面真实注意图之间的m1范数误差,LAdv_B AP M S−Net表示对抗性损失。λ1设为10000,λ2设为2.5。另外,鉴别器的损耗定义为 

其中LD_B AP M S−Net是先前研究提出的用于训练鉴别器的损失函数。LWReal和LWFake分别为经过鉴别器的真patch map和假patch map的Wasserstein loss[43]。LG P为梯度罚损。

3.实验结果

 

 


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 本文介绍了闭包的定义和运转机制,重点解释了闭包如何能够接触外部函数的作用域中的变量。通过词法作用域的查找规则,闭包可以访问外部函数的作用域。同时还提到了闭包的作用和影响。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • JavaScript设计模式之策略模式(Strategy Pattern)的优势及应用
    本文介绍了JavaScript设计模式之策略模式(Strategy Pattern)的定义和优势,策略模式可以避免代码中的多重判断条件,体现了开放-封闭原则。同时,策略模式的应用可以使系统的算法重复利用,避免复制粘贴。然而,策略模式也会增加策略类的数量,违反最少知识原则,需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例,说明了策略模式的应用场景和实现方式。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 面试经验分享:华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试
    最近有朋友去华为面试,面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败,因为缺乏基础知识。面试问题涉及 ... [详细]
author-avatar
昆仑神奇_325
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有