[DeeplearningAI笔记]卷积神经网络4.6-4.10神经网络风格迁移

作者：群-众-生-活 | 来源：互联网 | 2023-08-12 15:33

4.4特殊应用:人脸识别和神经网络风格转换觉得有用的话,欢迎一起讨论相互学习~FollowMe4.6什么是神经网络风格转换neuralstyletransfer将原图片作为内容

4.4特殊应用:人脸识别和神经网络风格转换

觉得有用的话,欢迎一起讨论相互学习~Follow Me

4.6什么是神经网络风格转换neural style transfer

将原图片作为内容图片Content，风格图片Style，生成的图片用Generated image 表示。

4.7深度卷积神经网络在学什么What are deep ConvNets learning

Zeiler, Matthew D., and Rob Fergus. "Visualizing and understanding convolutional networks." European conference on computer vision. Springer, Cham, 2014.

假设你在学习的神经网络结构如图:
将训练集中的所有图片都经过神经网络，然后弄明白哪一张图片最大限度的激活了神经网络中的特定单元。
- 原文如下:
  - Pick a unit in layer 1.Find the nine image patches that maximize the unit's activation.
  - Repeat for other units.
- 个人理解:
  - 对于第一层卷积层，将数据集中的所有图片都通过第一层卷积层。输出其通过第一层卷积层后的数值，挑选出最大的九个数值对应的九张图片块(个人理解为是一张图片经过感受野所得到的子图片)。将这个算法运用到第一个卷积层上的所有神经元上，输出一个缩略特征图。
其中更深层次的神经元可以看见数据集原始图像中更大的区域，可以假设，每一个神经元都会影响神经网络更深层的输出

Layer1

Layer2

Layer3

Layer4

Layer5

4.8神经风格迁移系统Cost function

Gatys L A, Ecker A S, Bethge M. A Neural Algorithm of Artistic Style[J]. Computer Science, 2015.

对于神经网络风格迁移系统，判断所生成的图片G的好坏很重要，需要有一个函数J作为损失函数(cost function)用来评价风格迁移的好坏。
- 首先将J(G)风格迁移损失函数切分为两个部分一个是内容图片部分(Content)，另一个是生成图片的部分(Generated image G).然后会把结果加上一个风格代价函数，一个关于(Style)S和(Generated image)G图片的函数--用来描述风格图片S和生成图片G的相似度。
- 然后使用\(\alpha\)和\(\beta\)两个参数来权衡内容代价和风格代价之间的权重。
- \[J(G)=\alpha J_{Content}(C,G)+\beta J_{style}(S,G)\]

算法流程

初始化生成图像G:
- 尺寸为\(100*100*3\),或者是\(500*500*3\)或者是任何你想要的尺寸。
使用梯度下降最小化损失函数J(G)
- 即 \[G=G-\frac{\alpha}{2G}J(G)\]

示例

如果原始图像为如下左图，风格图片为如下右图:
图片迭代改变过程如下图所示:

4.9神经网络风格迁移内容代价函数 Content cost function

图像内容代价函数

Gatys L A, Ecker A S, Bethge M. A Neural Algorithm of Artistic Style[J]. Computer Science, 2015.

\[J(G)=\alpha J_{Content}(C,G)+\beta J_{style}(S,G)\]

使用第l个隐藏层上的值来计算内容代价函数
- 如果l值很小，那么生成的图像在像素上很像内容图像
- 如果使用的l很大，那么生成的图像会偏风格化，而模糊原始图像的内容
- 所以一般l不会选的太深也不会太浅，会选择在网络中层数的中间位置
使用\(a^{[l](C)}和a^{[l](G)}\)表示层数l的激活值。
- 如果这两个值相似，则表示这两张图片上的内容相似
- \(J_{content}(C,G)=(a^{[l](C)}-a^{[l](G)})^{2}\)

4.9神经网络风格迁移风格代价函数 Content cost function

Gatys L A, Ecker A S, Bethge M. A Neural Algorithm of Artistic Style[J]. Computer Science, 2015.

假设使用神经网络模型中的深度l作为风格的深度测量
- 则把第l层不同通道之间激活值的相关系数作为风格--Define style as correlation between activations across channels.
对于一个具有5个通道的激活值特征图而言，不同通道对应位置可以组成激活函数值对。通过不同通道上下对应位置的激活函数值对可以计算不同通道之间的相关系数。
不同的通道对应不同的特征子图，对应不同卷积核上神经元识别的特征结果
两个通道的激活值具有很大的相关性，意思是:而。当两个神经元的激活值具有很大的

图像风格诠释

红色框中的神经元识别的是具有竖直条纹的特征
黄色框中的神经元识别的是具有橙色纹理的特征
假如红色和黄色框中的激活值具有很大的相关性，表明具有竖直条纹的子图很可能是橙色纹理的
如果相关性不大，表明竖直条纹的子图很大概率不是橙色的
相关性即是表明两个特征同时出现的概率

图像风格矩阵

为了研究风格图像或者生成图像的风格，使用第l层神经元的激活值来测量图片的风格。
i,j,k分别表示该位置的高度和宽度以及对应的通道数，则第l层，(i,j,k)位置处的激活函数值可被表示为:\(a^{[l]}_{(i,j,k)}\)
用\(G^{[L](S)}_{K,K'}\)表示S代表风格图片风格计算，L表示在第L层上计算图像风格，K和K'是用来计算相关性的L层的两个通道。风格图片的风格计算公式可如下表示:
\[G^{[L](S)}_{K,K'}=\sum^{n^{[l]}_{H}}_{i=1}\sum^{n^{[l]}_{W}}_{j=1}a^{[l](S)}_{i,j,k}a^{[l](S)}_{i,j,k'}\]
生成图像的风格计算公式可如下表示：
\[G^{[L](G)}_{K,K'}=\sum^{n^{[l]}_{H}}_{i=1}\sum^{n^{[l]}_{W}}_{j=1}a^{[l](G)}_{i,j,k}a^{[l](G)}_{i,j,k'}\]
在线性代数中，图像风格矩阵(Style matrix)也被称为“Gram matrix”,\(G^{[l]}\)是最终计算出的图像风格，其大小为\(n^{[l]}_{c} * n^{[l]}_{c}\)正方形的矩阵，其中\(n^{[l]}_{c}\)表示第l层特征图的通道数。即\(G^{[l]}\)会由\(G^{[L](S)}_{K,K'}\)生成，其中参数k和k'会遍历\(n^{[l]}_{c}\)，即L层上特征图中的所有通道。

图像风格代价函数

当然如果对每一层都是用风格代价函数会让结果变得更好，此时表达式可表示为:
\[J_{style}(S,G)=\sum_{l}\lambda^{[l]}J_{style}^{[l]}(S,G)\]
其中，S表示风格图像，G表示生成图像，l表示遍历所有层，\(\lambda\)表示一些额外的超参数，这样能够在考虑风格切换的代价函数时同时考虑浅层的低级和更深层的高级特征。

风格迁移总体代价函数

如果在所有层上都计算风格迁移的内容和风格代价函数，则其可表示为:
\[J(G)=\alpha J_{content}(C,G)+\beta J_{style}(S,G)\]

推荐阅读

get
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
get
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
get
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
java
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
search
杜甫《喜晴》的两种英译比较

本文对比了杜甫《喜晴》的两种英文翻译版本：a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑，b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ... [详细]

蜡笔小新 2024-11-12 15:02:28
search
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
java
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
search
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
search
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
search
非计算机专业的朋友如何拿下多个Offer

大家好，我是归辰。秋招结束后，我已顺利入职，并应公子龙的邀请，分享一些秋招面试的心得体会，希望能帮助到学弟学妹们，让他们在未来的面试中更加顺利。 ... [详细]

蜡笔小新 2024-11-13 18:41:58
search
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
get
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
get
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
get
深切明白ES6笔记（三）函数

重要知识点有：函数参数默许值、盈余参数、扩大运算符、new.target属性、块级函数、箭头函数以及尾挪用优化《深切明白ES6》笔记目次函数的默许参数在ES5中，我们给函数传参数， ... [详细]

蜡笔小新 2024-11-12 14:57:05
search
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27

群-众-生-活

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章