热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【论文阅读】GradientGuidedImageDeblockingUsingConvolutionalNeuralNetworks的详解

论文:GradientGuidedImageDeblockingUsingConvolutionalNeuralNetworks作者:CheolkonJ

论文:Gradient Guided Image Deblocking Using Convolutional Neural Networks
作者:Cheolkon Jung
年份:2019年
期刊:ACM Multimedia Asia

文章目录

  • 摘要
  • 1 介绍
  • 2 提出的方法
    • 2.1 网络结构
    • 2.2 Gradient Inference Network
    • 2.3 Image Inference Network
  • 3 实验结果
    • 3.1 准备
    • 3.2 研究
    • 3.3 比较
  • 结论


摘要

基于块的变换编码本质上会导致块状伪影,这会严重降低图片质量,尤其是在高压缩率下。压缩图像的梯度具有与原始梯度不同的特征,原始梯度沿块边界在像素值上有巨大变化。本文提出了基于CNN的梯度引导图像去块。在输入块状图像的梯度信息的指导下,所提出的网络成功地保留了纹理边缘,同时减少了块状边缘,从而从压缩降级中恢复了原始的清晰图像。实验结果表明,输入压缩图像中的梯度信息有助于减少伪像,并且该方法在视觉质量和客观测量方面均实现了显着的性能提升。

1 介绍

深度学习已被证明具有减少压缩图像中的块状伪像的强大功能。但是,先前的工作没有考虑网络体系结构中的图像先验。本文假设梯度稀疏性先验使网络模型更精确地检测出阻塞伪像。梯度已被证明是图像恢复任务的有用提示。基于块的压缩由于独立编码而没有考虑与相邻块的相关性,从而导致块边界处的严重变化。由于独立的基于块的编码,像素值在块边界处发生了严重变化,因此它们的梯度值变高。图1显示了由JPEG图像压缩引起并由提出的梯度推断网络(GiN)估计的梯度图。 GiN估计的梯度图成功去除了沿块边界的块状边缘,这表明梯度恢复有助于图像去块。因此,本文利用压缩图像中的梯度信息作为辅助信息,对图像进行去块。仅通过边缘检测从输入的压缩图像中获得梯度信息。
本文的主要贡献如下:
(1)提出基于CNN的梯度引导图像去块。 在压缩图像的梯度信息的指导下,所提出的网络成功地保持了纹理边缘不被压缩降解,减少了块状边缘。
(2)结合了GiN和图像推理网络(IiN)的两个协作子网,以进行梯度引导的图像去块。GiN估计原始图像的梯度图,IiN生成无伪像的图像。

注: JPEG是常见的有损编码方法。
尽管JPEG由于其规则性和硬件实现的简便性而在各种应用程序中普遍采用JPEG,但它给压缩图像带来了不希望的伪像。
在JPEG编码器中,基于8×8块的独立变换和量化不可避免地在块边界引入了令人讨厌的不连续性。 低比特率时严重出现阻塞伪像。


2 提出的方法

2.1 网络结构

传统的去块方法仅将压缩伪像减少视为不适定问题,忽略了压缩图像的先验信息。 与传统方法不同,本文将梯度推断和图像推断结合到一个统一的框架中,以执行梯度引导的图像去块。 如图2所示。
在这里插入图片描述

基于CNN采用两个协作子网进行图像去块:梯度推理网络(GiN)和图像推理网络(IiN)。 GiN估计原始图像的梯度图,而IiN生成无伪像的图像,即原始图像。 两个子网具有相似的结构:特征提取,具有多个卷积层的多个单元的堆栈以及重构网络。 将𝑋和Θ分别表示为输入权重和网络权重,如下所示:
在这里插入图片描述
其中𝑓𝑒𝑥𝑡表示特征提取函数,𝐵0是提取的要发送到下一层的特征。 假设𝑁个卷积单元堆叠在特征提取的后面,得到:
在这里插入图片描述
其中𝑓𝑛表示第𝑛个单位函数,𝐵𝑛-1和𝐵𝑛分别是第𝑛个单位的输入和输出。 最后,提出的网络模型在重建网络中使用卷积层来重建残差图像,如下所示:
在这里插入图片描述
其中𝑓𝑟𝑒𝑐表示重建函数,𝐵𝑟𝑒𝑐表示重建残差。 如图2所示,𝑓𝑒𝑥𝑡和𝑓𝑟𝑒𝑐由一个卷积层进行。 将𝐹表示为所提出模型的函数,其公式如下:
在这里插入图片描述

2.2 Gradient Inference Network

梯度推理网络(GiN)旨在学习从块状图像及其梯度图到ground truth的组合的映射。 如图2所示,特征提取是通过具有64个特征图的卷积层进行的。 GiN包含4个卷积单元,由4层组成,以整流线性单元(ReLu)作为激活函数。 将∇X和∇𝑌分别表示为输入图像的梯度图及其ground truth情况。 通过最小化以下均方误差(MSE)损失函数来预测输出补丁:
在这里插入图片描述
𝐹𝐺表示GiN函数。 图1说明GiN成功去除了块状边缘,同时保留了原始图像的纹理边缘。

2.3 Image Inference Network

图像推断网络(IiN)在GiN的指导下估算无伪影的图像。 在IiN中,将6个卷积层作为一个卷积单元,每个单元都共享GiN中相应单元的特征。 串联公式如下:
在这里插入图片描述
其中B𝑛G表示来自GiN的特征图。 将MSE损失函数最小化,以估计最佳的无伪像,如下所示:
在这里插入图片描述
其中𝐹𝐼表示IiN函数,𝑍表示与GiN共享的特征图,𝑌表示ground truth的Y通道。 最终的目标函数是等式(5)和(7)的组合。 ,并且同时进行了优化。

3 实验结果

3.1 准备

通过使用MATLAB JPEG编码器以质量因子q = 40、30、20、10压缩原始图像来生成输入块图像。 所有实验均根据与ARCNN,TNRD 和DnCNN 先前方法相同的协议在亮度通道上进行。训练时,将JPEG压缩的色块用作输入,并将相应的ground truth用作标签。 考虑到训练时间和存储复杂性,从图像对中提取了步长为20的32×32色块。 每个图像对都是随机翻转或旋转的,因此最终的训练数据是两次。 将批处理大小设置为32,初始学习率设置为10−4,然后每5个周期除以2。

3.2 研究

在这里插入图片描述
在这里插入图片描述
如图所示,梯度引导会影响去块性能。 也就是说,与使用GiN的IiN相比,单独使用IiN可以实现相对较低的PSNR和SSIM改善。 它验证了梯度引导在图像恢复中起着重要作用。 除了LIVE1数据集中的PSNR结果外,具有GiN的IiN通常以较低的 quality factor(即较高的压缩率)获得更多的增益。
表1显示了units数量影响去块性能(更多的units会产生更好的性能)。 本文为GiN采用四个units。

3.3 比较

在这里插入图片描述
与三种减少伪影的方法进行了比较:ARCNN,TNRD 和最新的通用图像恢复框架DnCNN 。如表2所示,采用PSNR和SSIM作为定量测量的评估指标,这些指标广泛用于图像质量评估。总体而言,所提出的方法在所有评估指标上均优于ARCNN和TNRD,并且比DnCNN具有更好的性能。在图4和图5中,当quality factor分别为10和20时。可以看出,所提出的方法有效地去除了由块状图像的梯度信息引导的块状伪影,且可以恢复比以前更高质量的图像。恢复的图像的质量改进来自块边界附近和块内的改进。这是因为本文为图像推断和梯度推断建立了两个子网:IiN和GiN。仔细观察发现,所提出的方法可以恢复更精细的纹理边缘而AR-CNN和DnCNN易于在纹理上产生失真。 因此,所提出的方法产生具有良好纹理的视觉上令人愉悦的解块结果。
在这里插入图片描述

结论

本文提出用于图像去块的梯度引导CNN。 采用GiN和IiN的两个协作子网,并同时对其进行优化,以恢复原始图像及其梯度图。 GiN估计原始图像的梯度图,而IiN产生无伪像的图像。 在压缩图像的梯度信息的指导下,所提出的网络成功地保留了输入压缩图像的纹理边缘,同时减少了块状边缘。 实验结果表明,该方法在视觉质量和定量测量方面均优于最新的图像去块网络模型。


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • HTML学习02 图像标签的使用和属性
    本文介绍了HTML中图像标签的使用和属性,包括定义图像、定义图像地图、使用源属性和替换文本属性。同时提供了相关实例和注意事项,帮助读者更好地理解和应用图像标签。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量,或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频,只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量,只有使用JAVA编写Android客户端才能实现压缩。此外,作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因,并提供了解决方法。最后,作者还介绍了一个用于处理图片的类,可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]
  • 突破MIUI14限制,自定义胶囊图标、大图标样式,支持任意APP
    本文介绍了如何突破MIUI14的限制,实现自定义胶囊图标和大图标样式,并支持任意APP。需要一定的动手能力和主题设计师账号权限或者会主题pojie。详细步骤包括应用包名获取、素材制作和封包获取等。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
author-avatar
Angels萱萱
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有