热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【文献阅读2020】像素级自适应学习的超分辨率PixelLevelSelfPacedLearningForSuperResolution

原文链接github摘要:近年来,基于深度网络的预测超分辨率图像在多个图像领域得到了广泛的应用。然而,随着这些网络的构建越来越深入

原文链接
github

摘要:近年来,基于深度网络的预测超分辨率图像在多个图像领域得到了广泛的应用。然而,随着这些网络的构建越来越深入,它们的训练时间也越来越长,这可能会引导学习者进行局部优化。为了解决这一问题,本文设计了一种像素级自适应学习(PSPL,PIXEL-LEVEL SELF-PACED LEARNING)训练策略来加速SISR模型的收敛速度。PSPL模拟自定步长学习,将预测的SR图像中的每个像素及其对应的ground truth中的像素赋予一个注意权值,引导模型在参数空间中找到一个更好的区域。大量的实验证明,PSPL可以加速SISR模型的训练,并促使现有的几个模型获得新的更好的结果。

总结: 这篇文章不是提出一个崭新的单张图像超分辨率模型,而是提出一个加速训练原有单张图像超分辨率模型的手段。 文章认为,之前的SRCNN、SRResNet、EDSR等模型确实有很好的表现,但是它们太大、太复杂,无法有效的训练(图1)他们可能会在训练上花费更多的时间;而且,有些模型即使训练了很长时间,也可能没有产生更好的结果。

几种常用的深层SISR模型的比较。采用SSIM和PSRN进行质量评价;multadd是用于预测具有固定大小的SR图像的乘法和加法的数量

博主认为,如果说其他超分辨率模型致力于前向传播的网络结构搭建,也就是如何学习从LR到SR的映射;那么,这篇文章关注点在于根据其他模型训练好的SR,如何利用SR和HR的关系来进行决定下一步的训练,即训练策略的问题。

不同于以往根据SR和HR,往往直接计算loss,然后进行反向传播,作者设计一个训练策略来加速这些模型的训练速度,进一步增强它们的反向传播性能

这篇文章提出了一个叫做 像素级自适应学习(PSPL) 的训练策略。其中每个样本都有一个学习权值,引导学习者学习更有效的特征,更快的收敛,更好的泛化。实际上,本文介绍的就是每次训练之后得到的SR和HR,先进行了一系列处理,然后再计算loss。 博主认为,这篇文章讲的是一种训练策略,这个过程并不在前向传播中。换句话说,文章是通过改变每次训练后的HR和SR,来改变loss的值,进一步影响反向传播中模型参数的变化的。

图2说明了PSPL如何切断和重新安排数据流。为了便于学习,每个训练阶段分为以下四个步骤。在给定LR图像和HR图像的情况下:
1.首先通过模型预测SR图像。
2.然后根据SR和HR图像生成相似度图(similarity map)
3.再次,在相似度图的基础上生成注意图(attention map),注意图对这些差异较大的像素对给予了更多的注意。
4.最后,通过注意图与原始SR(HR)图像的逐项相乘得到新的SR(HR)图像,并在计算损耗时将原始SR(HR)图像替换为新的SR(HR)图像,从而影响SISR模型的优化。此外,在整个训练过程中,随着训练步骤的增加,注意图中的所有值都将趋近于一个常数,这意味着PSPL在整个训练过程中的效用逐渐降低。

PSPL的名称来自两个方面。一是随着训练时间的延长,所有注意力的重量逐渐降低,这与自主学习增加学习对象难度的过程相似;另一种是PSPL为图像中的每个像素分配注意权值,这与传统的样本级自定步长学习中为样本分配权值不同。



上面的四点具体步骤如下:

设SR代表超分辨率结果,和HR同尺寸。
1.学习LR到HR的映射F,得到SR(也就是前人提出的SISR方法);
2.根据SR和HR图像生成相似度图(similarity map)。
(1)SR和HR对应的 patches(psp_sps,php_hph)分别和圆对称高斯权重矩阵(a circular-symmetric Gaussian weighting matrix)做点乘(element-wise multiplication),得到 ps^\hat{p_s}ps^ , ph^\hat{p_h}ph^ ;


(2)根据ps^\hat{p_s}ps^ , ph^\hat{p_h}ph^ 的均值、方差,根据SSIM计算公式得到每个patch的 msm_sms,然后得到整张图片的 MsM_sMs .
CCC里的两个参数k1k_1k1 k2k_2k2是人工设置的
使用SSIM的好处:

首先,SSIM是一种基于感知的准则,它在空间上是平稳的。 其次,SSIM能够利用其相邻像素值,使其与绝对差异相比较更稳定




3.生成注意力图Attention Map

MsM_sMs经过一个高斯函数G,产生 MaM_aMa :
这个高斯函数的三个参数 γ\gammaγ μ\muμ δ\deltaδ分别代表峰值大小 峰值的位置 和 宽度。 在PSPL中,G更多地关注具有较小相似性的这些像素对. 这些参数是人工选择的。这些参数在训练过程中都是常数。


下面是某个patch的输入SSIM指数(msm_sms)和输出Attention Map(mam_ama)以及训练阶段的变化图:


4.Loss function

将Attention Map(MaM_aMa)分别和SR HR做点乘(Fig2 绿色实线),对得到的两个结果做Loss。

由于MsM_sMsMaM_aMa 只是为了得到新的SR,HR来计算Loss,不在SISR网络内部,因此这一过程不参与反向传播,只是用于训练中。毕竟前面已经强调了,这篇文章讲的是一种训练策略,这个过程并不在前向传播中。换句话说,文章是通过改变HR和SR,来改变loss的值,进一步影响反向传播中模型参数的变化的。

结果

不同模型下,是否应用该训练策略的效果对比:



推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • PHP图片截取方法及应用实例
    本文介绍了使用PHP动态切割JPEG图片的方法,并提供了应用实例,包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用,以及图片切割的具体步骤。同时,还提供了一些注意事项和优化建议。通过本文的学习,读者可以掌握PHP图片截取的技巧,实现自己的需求。 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • Html5-Canvas实现简易的抽奖转盘效果
    本文介绍了如何使用Html5和Canvas标签来实现简易的抽奖转盘效果,同时使用了jQueryRotate.js旋转插件。文章中给出了主要的html和css代码,并展示了实现的基本效果。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文整理了315道Python基础题目及答案,帮助读者检验学习成果。文章介绍了学习Python的途径、Python与其他编程语言的对比、解释型和编译型编程语言的简述、Python解释器的种类和特点、位和字节的关系、以及至少5个PEP8规范。对于想要检验自己学习成果的读者,这些题目将是一个不错的选择。请注意,答案在视频中,本文不提供答案。 ... [详细]
  • Android Studio Bumblebee | 2021.1.1(大黄蜂版本使用介绍)
    本文介绍了Android Studio Bumblebee | 2021.1.1(大黄蜂版本)的使用方法和相关知识,包括Gradle的介绍、设备管理器的配置、无线调试、新版本问题等内容。同时还提供了更新版本的下载地址和启动页面截图。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 深入解析Linux下的I/O多路转接epoll技术
    本文深入解析了Linux下的I/O多路转接epoll技术,介绍了select和poll函数的问题,以及epoll函数的设计和优点。同时讲解了epoll函数的使用方法,包括epoll_create和epoll_ctl两个系统调用。 ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
author-avatar
315热点关注
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有