热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ConvolutionalNeuralNetworksforNoReferenceImageQualityAssessment

KangL,KumarJ,YeP,etal.ConvolutionalNeuralNetworksforDocumentImageClassification文章目录1.介绍2.相

Kang L, Kumar J, Ye P, et al. Convolutional Neural Networks for Document Image
Classification


文章目录

      • 1. 介绍
      • 2. 相关工作
      • 3. CNN for NR-IQA
        • 3.1 网络结构
        • 3.2 Local Normalization局部标准化
        • 3.3 Pooling池化
        • 3.4 ReLU 激活函数
        • 3.5 Learning
      • 4 实验


1. 介绍

将图像块作为输入,CNN在空间域中工作,而不使用大多数先前方法所采用的手工计算的特征。视觉质量是图像的非常复杂但固有的特征。在CNN常用的图像识别领域提取的是局部不变性特征,而IQA领域需要提取NSS特征。所以直接将CNN网络用于IQA是不行的,作者文中提到的一个贡献 是修改了网络结构,以便更有效地学习图像质量特征并更准确地估计图像质量。论文的另一个贡献 是提出了一个新的框架,允许学习和预测局部区域的图像质量。作者的方法是可以估计分块(32*32)的质量,局部质量估计对于图像去噪或重建,图像增强等问题很重要。


2. 相关工作


3. CNN for NR-IQA

首先将灰度图,进行对比度标准化,然后不重叠的将图片分块,然后使用CNN预测每一块的质量分数,然后平均每一块的得分得到整张图片的质量分数。


3.1 网络结构

网络包括5层:网络的结构图如下
在这里插入图片描述

32x32 --> 26x26x50 --> 2x50 --> 800 --> 800 --> 1
第一层是一个卷积层,使用50个卷积核为7x7的滤波器,no zero-padding , stride = 1。
第二层是池化层,将50个特征图池化为一个最大值和一个最小值。2x50
然后是两个全连接层每个有800个节点
最后一层是简单的线性回归得到我们的预测结果


3.2 Local Normalization局部标准化

在 BRISQUE 和 CORNIA 中,都用到了对比度标准化(contrast normalization)
在本文中作者使用了局部对比度标准化
在这里插入图片描述

P,Q是标准化的窗口大小,因为我们用的是局部的对比度标准化,在 BRISQUE 中作者提出局部对比度标准化的窗口应该设置的小一些,这样会取得更好的效果。在本文中我们设置 P = Q = 3 ,注意到应用局部对比度标准化,每个像素可以具有不同的局部均值和方差。

在使用CNN的图像识别领域,对比度标准化(contrast normalization)经常用于整幅图片。归一化不仅缓解了使用sigmod 神经元的早期工作中常见的饱和问题,而且使网络对光照和对比度变化具有鲁棒性。另外,尽管在某些应用中亮度和对比度变化可以被认为是失真,但我们主要关注由图像劣化引起的失真,例如模糊,压缩和加性噪声。


3.3 Pooling池化

具体来说,每个特征映射汇集成一个最大值和一个最小值,这与CORNIA类似。仅仅使用max-pooling的效果就已经很好,这里使用min提升了2% 的性能。这里对整个特征图提2个max和min是因为:作者认为失真通常是局部均一的,也就是说同一水平的失真会在整个块(32x32)中呈现。在图像失真中缺乏明显的全局空间结构使得能够在不保持位置的情况下进行合并以降低计算成本。


3.4 ReLU 激活函数

在两个全连接层之间使用Rectified Linear Units(ReLU)激活函数来增加非线性。作者提出因为ReLU仅允许非负的信号通过,所以我们在卷积层和池化层使用线性神经元。原因是最小池化通常产生负值,我们不希望阻止这些负池化输出中的信息。


3.5 Learning

我们用原图像的质量分数作为每一块的质量分数,因为我们认为失真是均一的。在测试阶段,我们对每一块的预测分数取平均值作为整幅图的质量分数。通过把块(32x32)作为网络的输入,和将整幅图作为输入相比大大增加了我们的训练样本。
损失函数:
在这里插入图片描述
在实验中,使用带动量的随机梯度下降算法(SGD, 40 epochs),在验证集上调整参数使得得到最高的线性相关系数 (LCC)
在第二个全连接层使用dropout = 0.5


4 实验

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

作者直观地检查了学习的卷积内核,发现只有少数内核呈现出与失真类型相关的明显结构。毫无疑问,CNN学习的内核往往是嘈杂的模式,而不是呈现与某些失真类型相关的强结构如CORNIA,是因为CORNIA的特征学习是无人监督的,属于生成模型,而我们的CNN受到监督训练并学习辨别特征。


This is because CORNIA’s feature learning is unsupervised and belongs to generative model while our
CNN is supervisedly trained and learns discriminative features.



推荐阅读
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • http:geek.csdn.netnewsdetail127365本系列文章面向深度学习研发者,希望通过ImageCaptionGeneration,一个有意思的具体任务,深入浅出地介 ... [详细]
  • 快过HugeCTR:用OneFlow轻松实现大型推荐系统引擎
    一、简介Wide&DeepLearning(以下简称WDL)是解决点击率预估(CTRPrediction) ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 本文介绍了如何使用MATLAB调用摄像头进行人脸检测和识别。首先需要安装扩展工具,并下载安装OS Generic Video Interface。然后使用MATLAB的机器视觉工具箱中的VJ算法进行人脸检测,可以直接调用CascadeObjectDetector函数进行检测。同时还介绍了如何调用摄像头进行人脸识别,并对每一帧图像进行识别。最后,给出了一些相关的参考资料和实例。 ... [详细]
  • 老电影和图片变清晰的秘密!分辨率提升400%的AI算法
    老电影和图片变清晰的秘密!分辨率提升400%的AI算法-如上图,从100x133pix→400x532pix,除了肉眼可见的清晰,拥有可以将分辨率提升400%的技术到底意味着什么 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了算法工程师(机器学习)面试题目4---深度学习算法相关的知识,希望对你有一定的参考价值。基础问题 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • HTML学习02 图像标签的使用和属性
    本文介绍了HTML中图像标签的使用和属性,包括定义图像、定义图像地图、使用源属性和替换文本属性。同时提供了相关实例和注意事项,帮助读者更好地理解和应用图像标签。 ... [详细]
  • MySQL8.0设置远程访问权限的方法
    这篇文章主要介绍了MySQL8.0设置远程访问权限的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着 ... [详细]
author-avatar
mobiledu2502924121
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有