热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

图像迁移风格保存模型_今日Paper|可视问答模型;神经风格差异转移;图像压缩系统;KSVD图像去噪等...

目录准确性与复杂性:可视问答模型中的一种权衡神经风格差异转移及其在字体生成中的应用基于GAN的可调整的图像压缩系统基于原始-对偶活动集算法的K-SVD图像去噪神经阅读
85ea4bf4af48707371fa3774bff07b4c.png

目录

  • 准确性与复杂性:可视问答模型中的一种权衡

  • 神经风格差异转移及其在字体生成中的应用

  • 基于GAN的可调整的图像压缩系统

  • 基于原始-对偶活动集算法的K-SVD图像去噪

  • 神经阅读理解与超越

准确性与复杂性:可视问答模型中的一种权衡

论文名称:Accuracy vs. Complexity: A Trade-off in Visual Question Answering Models

作者:Farazi Moshiur R. /Khan Salman H. /Barnes Nick

发表时间:2020/1/20

论文链接:https://paper.yanxishe.com/review/9627?from=leiphonecolumn_paperreview0211

推荐原因

这篇论文考虑的是视觉问答的问题。

为了验证AI的推理能力,视觉问答(Visual Question Answering,VQA)被用作一种视觉图灵测试。现有VQA模型的关键是将图像的视觉特征与给定问题的语义特征相结合而学习到联合嵌入。大量的研究聚焦于利用视觉注意力机制来设计复杂的联合嵌入策略,以有效捕捉视觉与语义间的交互作用。但是,在高维空间构建视觉与语义特征计算量极大,模型越来越复杂,对VQA准确率带来的提升却很小。这篇论文系统地研究了模型复杂度和性能两方面的折中策略,并且特别关注了这些模型在多模态融合方面的效果。通过实验,这篇论文给出了如何优化以降低复杂性和如何优化以实现当前最佳VQA性能的提升这两个方面的建议。

52643eb0463c40d891ce59c1b940d38c.png171a9ca11aa697fd3ca14d4247dfef86.png

神经风格差异转移及其在字体生成中的应用

论文名称:Neural Style Difference Transfer and Its Application to Font Generation

作者:Atarsaikhan Gantugs /Iwana Brian Kenji /Uchida Seiichi

发表时间:2020/1/21

论文链接:https://paper.yanxishe.com/review/9626?from=leiphonecolumn_paperreview0211

推荐原因

这篇论文了介绍一种自动创建字体的方法,找到两种不同字体之间的字体样式差异,并使用神经样式转移将其转换为另一种字体。这篇论文提出了一种新的神经风格差异和内容差异损失神经风格转移方法。根据这些损失,可通过在字体中添加或删除字体样式来生成新字体。基于各种输入字体组合的实验结果,这篇论文还讨论了所提方法的局限性和未来的工作。

02e3df127460c0726d28de861101451a.png0dd1749ea9e1b5e54144fbe2e96dab03.png6ddb9bbeab19efede1980397c105c0fd.png

基于GAN的可调整的图像压缩系统

论文名称:A GAN-based Tunable Image Compression System

作者:Wu Lirong /Huang Kejie /Shen Haibin

发表时间:2020/1/18

论文链接:https://paper.yanxishe.com/review/9625?from=leiphonecolumn_paperreview0211

推荐原因

这篇论文考虑的是图像压缩的问题。

在基于深度神经网络的有损图像压缩中,重要性图方法被广泛应用,以根据图像内容的重要性来实现比特分配,然而这种方法容易出现严重失真。这篇论文提出使用生成对抗网络重构非重要区域,将多尺度金字塔分解方法应用于编码器和判别器,以实现高分辨率图像的全局压缩。同时这篇论文还提出了一种可调整的压缩方案,将图像压缩为任何特定的压缩率,而无需重新训练模型。实验结果表明,与最新的基于GAN的方法相比,这篇论文提出的方法在MS-SSIM数据集实现了10.3%以上的改进。

b828370414e724057f247bb6645875da.png3ed048b1604296e97d66ffa31f0757ea.png5cfe8d74bbd40bdb2073a00a29458670.pngdfebcc94062c9000f52e2486788b07fd.png

基于原始-对偶活动集算法的K-SVD图像去噪

论文名称:Image denoising via K-SVD with primal-dual active set algorithm

作者:Xiao Quan /Wen Canhong /Yan Zirui

发表时间:2020/1/19

论文链接:https://paper.yanxishe.com/review/9624?from=leiphonecolumn_paperreview0211

推荐原因

这篇论文改进了用于图像去噪的K-SVD算法。在K-SVD的稀疏编码步骤中,一旦噪音等级变高,寻找贪心近似解的效果就下降了。这篇论文提出了一种新的名为K-SVD_P的框架,加入了原始对偶有效集(Primal-Dual Active Set,PDAS)算法。K-SVD_P与基于贪心算法的K-SVD不同,发展出一套利用KKT条件的选择策略,并在稀疏编码阶段产生有效的更新。由于K-SVD_P使用简单的显式表达式来迭代地寻找对偶问题的等效解决方案,可以在去噪的速度与质量上取得更好的效果。论文中的实验也验证了K-SVD_P的降噪性能。

271c52e68a63c6c8fc69b70d090b3416.png4f288344b1ed0a848bc07a52efe014c9.png80a2ba271df518dea6cb0d6928331fa4.png

神经阅读理解与超越

论文名称:NEURAL READING COMPREHENSION AND BEYOND

作者:Danqi Chen

发表时间:2019/12/21

论文链接:https://paper.yanxishe.com/review/9622?from=leiphonecolumn_paperreview0211

推荐原因

这篇论文是陈丹琦的博士论文,作为nlp领域的大牛,这篇文章很是优秀推荐给大家,这篇论文已经成为了NLP研究者的必读论文,这篇论文难得可贵的是向nlp研究者们展示了,如何在研究过程中面对挑战解决问题。

这篇论文可以看作是综述类文章,里面既有其它人的研究,也有自己的研究,推荐大家阅读。

a78fd25ad08c49ef27794daa40512bae.pngc3a72133cbe55e1f931dda3c65b94308.pngef2d82c9edefadf28fe5054e61d8b514.png

论文作者团队招募

为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块,希望以论文作为聚合 AI 学生青年的「兴趣点」,通过论文整理推荐、点评解读、代码复现。致力成为国内外前沿研究成果学习讨论和发表的聚集地,也让优秀科研得到更为广泛的传播和认可。

我们希望热爱学术的你,可以加入我们的论文作者团队。

加入论文作者团队你可以获得

1.署着你名字的文章,将你打造成最耀眼的学术明星

2.丰厚的稿酬

3.AI 名企内推、大会门票福利、独家周边纪念品等等等。

加入论文作者团队你需要:

1.将你喜欢的论文推荐给广大的研习社社友

2.撰写论文解读

如果你已经准备好加入 AI 研习社的论文兼职作者团队,可以添加运营小姐姐的微信,备注“论文兼职作者”

9f38ff373a9dae25c82e5e944947d234.png

雷锋网雷锋网雷锋网



推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • [转载]从零开始学习OpenGL ES之四 – 光效
    继续我们的iPhoneOpenGLES之旅,我们将讨论光效。目前,我们没有加入任何光效。幸运的是,OpenGL在没有设置光效的情况下仍然可 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • Vue基础一、什么是Vue1.1概念Vue(读音vjuː,类似于view)是一套用于构建用户界面的渐进式JavaScript框架,与其它大型框架不 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • Opencv提供了几种分类器,例程里通过字符识别来进行说明的1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。函数原型:训练原型cv ... [详细]
author-avatar
ABC13517626247
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有