当前位置: 开发笔记 > 编程语言 > 正文

pytorch实现GAN（生成对抗网络）生成二次元头像（附代码）

作者：繁華落盡灬熙 | 来源：互联网 | 2023-08-11 15:31

目录GAN基本概念GAN算法流程代码实现与讲解1、准备数据集代码实现定义鉴别器定义生成器训练补充附完整代码参考链接及书目GAN基本概念GAN,全称Genera

GAN基本概念

GAN算法流程

代码实现与讲解

1、准备数据集

代码实现

定义鉴别器

定义生成器

训练

补充

附完整代码

参考链接及书目

GAN基本概念
GAN, 全称Generative Adversarial Networks&＃xff0c;中文名为生成对抗网络&＃xff0c;是一种深度学习模型&＃xff0c;是近年来复杂分布上无监督学习最具前景的方法之一。主要包括生成网络和对抗网络。想要具体了解其实现原理的可以看一下Ian Goodfellow大牛的论文&＃xff1a;Generative Adversarial Networks&＃xff0c;这篇paper算是这个领域的开山之作。
使用生成对抗网络的目的就是生成一些接近真实的东西&＃xff0c;比如让机器自己生成一幅画、一段文字&＃xff0c;甚至是在数据匮乏的情况下&＃xff0c;生成一些我们需要的数据集等等。而“对抗”就是为了让网络变得“聪明”。比如有人靠仿制前朝的翡翠、瓷器等宝物谋生&＃xff0c;为了制作出高仿的物品&＃xff0c;他肯定要先看许多真的宝物&＃xff0c;然后经过多次模仿和训练&＃xff0c;他仿制的宝物骗过了鉴宝师的眼睛。但正所谓“魔高一尺道高一丈”&＃xff0c;鉴定专家也不断提高自己的技术&＃xff0c;慢慢的他以前的作品就被专家看出是假的&＃xff0c;于是他又进行训练提高自己的仿制技术&＃xff0c;再次骗过鉴宝专家的眼睛&＃xff08;宝友&＃xff0c;可不兴啊~~~&＃xff09;。然而没过多久&＃xff0c;鉴宝专家技术提升又识别出了他仿制的赝品&＃xff0c;所以他又必须再提高&＃xff0c;循环往复&＃xff0c;这就是一个对抗的过程。
而生成器则主要是根据我们的输入&＃xff0c;产生一些真实的输出&＃xff0c;用来训练鉴别器识别真伪的能力。

GAN算法流程
生成对抗网络的算法流程如下&＃xff1a;
1、初始化生成器和鉴别器&＃xff1b;
2、训练迭代直至满足条件。主要过程包括以下两个部分&＃xff1a;
1&＃xff09;固定生成器&＃xff0c;升级鉴别器。向生成器输入随机向量&＃xff0c;产生一些输出&＃xff0c;标注为0&＃xff0c;表示为假数据。然后从真实数据集抽取一些数据&＃xff0c;标注为1&＃xff0c;表示为真数据。用真假混合的数据集训练鉴别器&＃xff08;其实就是一个二分类模型&＃xff09;。
2&＃xff09;固定鉴别器&＃xff0c;升级生成器。将生成器和鉴别器连成一个网络&＃xff0c;由生成器根据随机输入产生的结果传入鉴别器&＃xff0c;鉴别器对数据的真实性进行打分&＃xff0c;越真实得到的分数越接近1.在这个过程中&＃xff0c;我们固定鉴别器参数&＃xff0c;只更新生成器参数&＃xff0c;使生成器产生的图片得到的分数越来越高&＃xff0c;也就是越来越接近真实数据。

代码实现与讲解

1、准备数据集

准备好真是的二次元头像数据集&＃xff0c;该数据集是从著名的动漫图库网站konachan.net中爬取的。随机抽取数据集中的图片样本&＃xff0c;像素大小为96*96&＃xff08;已对爬取的头像进行了处理&＃xff09;。

在代码文件所在同级目录创建名为imgs的文件夹&＃xff0c;并在imgs下新建0和1两个文件夹&＃xff0c;将真实数据集存放在文件夹imgs下的1文件夹中。

代码实现

首先导入需要用到的库&＃xff0c;并定义图片预处理方式、训练集和训练加载器的工作方式。

import torch import torch.nn as nn import torchvision from torchvision import datasets, transforms import matplotlib.pyplot as plt# 图片显示 def img_show(inputs, picname):plt.ion()inputs &＃61; inputs / 2 &＃43; 0.5inputs &＃61; inputs.numpy().transpose((1, 2, 0))plt.imshow(inputs)plt.pause(0.01)plt.savefig(picname &＃43; ".jpg")plt.close()# 串联多个变换操作 data_transform &＃61; transforms.Compose([transforms.RandomHorizontalFlip(), # 依概率p水平翻转&＃xff0c;默认p&＃61;0.5transforms.ToTensor(), # 转为tensor&＃xff0c;并归一化至[0-1]# 标准化&＃xff0c;把[0-1]变换到[-1,1]&＃xff0c;其中mean和std分别通过(0.5,0.5,0.5)和(0.5,0.5,0.5)进行指定。# 原来的[0-1]最小值0变成(0-0.5)/0.5&＃61;-1&＃xff0c;最大值1变成(1-0.5)/0.5&＃61;1transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5]) ])# 参数data_transform&＃xff1a;对图片进行预处理的操作&＃xff08;函数&＃xff09;&＃xff0c;原始图片作为输入&＃xff0c;返回一个转换后的图片。 train_set &＃61; datasets.ImageFolder(&＃39;imgs&＃39;, data_transform) train_loader &＃61; torch.utils.data.DataLoader(train_set, batch_size&＃61;5,shuffle&＃61;True, num_workers&＃61;4) # 数据加载inputs, _ &＃61; next(iter(train_loader)) # make_grid的作用是将若干幅图像拼成一幅图像 img_show(torchvision.utils.make_grid(inputs), "RealDataSample")

定义鉴别器

为了生成高质量的图片&＃xff0c;使用深度卷积神经网络作为鉴别器&＃xff0c;使用深度反卷积神经网络作为生成器。每次卷积之后使用批归一化和LeakyReLU激活函数加速收敛。代码如下&＃xff1a;

# 定义鉴别器 class Discriminator(nn.Module):def __init__(self, nc, ndf):super(Discriminator, self).__init__()# 使用深度卷积网络作为鉴别器self.layer1 &＃61; nn.Sequential(nn.Conv2d(nc, ndf, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.BatchNorm2d(ndf), nn.LeakyReLu(0.2, inplace&＃61;True))self.layer2 &＃61; nn.Sequential(nn.Conv2d(ndf, ndf * 2, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.BatchNorm2d(ndf * 2), nn.LeakyReLu(0.2, inplace&＃61;True))self.layer3 &＃61; nn.Sequential(nn.Conv2d(ndf * 2, ndf * 4, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.BatchNorm2d(ndf * 4), nn.LeakyReLu(0.2, inplace&＃61;True))self.layer4 &＃61; nn.Sequential(nn.Conv2d(ndf * 4, ndf * 8, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.BatchNorm2d(ndf * 8), nn.LeakyReLu(0.2, inplace&＃61;True))self.fc &＃61; nn.Sequential(nn.Linear(256 * 6 * 6, 1), nn.Sigmoid())def forward(self, x):out &＃61; self.layer4(self.layer3(self.layer2(self.layer1(x))))out &＃61; self.fc(out.view(-1, 256 * 6 * 6))return out

定义生成器

生成器主要完成由随机向量生成图片的过程。代码如下&＃xff1a;

# 定义生成器 class Generator(nn.Module):def __init__(self, nc, ngf, nz, feature_size):super(Generator, self).__init__()self.prj &＃61; nn.Linear(feature_size, nz * 6 * 6)# nn.Sequential&＃xff1a;一个有序的容器&＃xff0c;神经网络模块将按照在传入构造器的顺序依次被添加到计算图中执行self.layer1 &＃61; nn.Sequential(nn.ConvTranspose2d(nz, ngf * 4, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.BatchNorm2d(ngf * 4), nn.ReLu())self.layer2 &＃61; nn.Sequential(nn.ConvTranspose2d(ngf * 4, ngf * 2, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.BatchNorm2d(ngf * 2), nn.ReLu())self.layer3 &＃61; nn.Sequential(nn.ConvTranspose2d(ngf * 2, ngf, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.BatchNorm2d(ngf), nn.ReLu())self.layer4 &＃61; nn.Sequential(nn.ConvTranspose2d(ngf, nc, kernel_size&＃61;4, stride&＃61;2, padding&＃61;1),nn.Tanh())def forward(self, x):out &＃61; self.prj(x).view(-1, 1024, 6, 6)out &＃61; self.layer4(self.layer3(self.layer2(self.layer1(out))))return out

训练

在构建了鉴别器和生成器之后&＃xff0c;先初始化鉴别器和生成器。

# 初始化鉴别器和生成器 d &＃61; Discriminator(3, 32) g &＃61; Generator(3, 128, 1024, 100)

然后设置损失函数和优化器。

criterion &＃61; nn.BCELoss() # 损失函数 lr &＃61; 0.0003 # 学习率 d_optimizer &＃61; torch.optim.Adam(d.parameters(), lr&＃61;lr) # 定义鉴别器的优化器 g_optimizer &＃61; torch.optim.Adam(g.parameters(), lr&＃61;lr) # 定义生成器的优化器

定义训练函数。

# 训练过程 def train(d, g, criterion, d_optimizer, g_optimizer, epochs&＃61;1, show_every&＃61;1000, print_every&＃61;10):iter_count &＃61; 0for epoch in range(epochs):for inputs, _ in train_loader:real_inputs &＃61; inputs # 真实样本fake_inputs &＃61; g(torch.randn(5, 100)) # 伪造样本real_labels &＃61; torch.ones(real_inputs.size(0)) # 真实标签fake_labels &＃61; torch.zeros(5) # 伪造标签real_outputs &＃61; d(real_inputs)d_loss_real &＃61; criterion(real_outputs, real_labels)fake_outputs &＃61; d(fake_inputs)d_loss_fake &＃61; criterion(fake_outputs, fake_labels)d_loss &＃61; d_loss_real &＃43; d_loss_faked_optimizer.zero_grad()d_loss.backward()d_optimizer.step()fake_inputs &＃61; g(torch.randn(5, 100))outputs &＃61; d(fake_inputs)real_labels &＃61; torch.ones(outputs.size(0))g_loss &＃61; criterion(outputs, real_labels)g_optimizer.zero_grad()g_loss.backward()g_optimizer.step()if (iter_count % show_every &＃61;&＃61; 0):print(&＃39;Epoch:{}, Iter:{}, D:{.4}, G:{.4}&＃39;.format(epoch,iter_count,d_loss.item(),g_loss.item()))picname &＃61; "Epoch_" &＃43; str(epoch) &＃43; "Iter_" &＃43; str(iter_count)img_show(torchvision.utils.make_grid(fake_inputs.data), picname)if (iter_count % print_every &＃61;&＃61; 0):print(&＃39;Epoch:{}, Iter:{}, D:{.4}, G:{.4}&＃39;.format(epoch,iter_count,d_loss.item(),g_loss.item()))iter_count &＃43;&＃61; 1print(&＃39;Finished Training&＃xff01;&＃39;)

开始训练。

# 训练 train(d, g, criterion, d_optimizer, g_optimizer, epochs&＃61;300)

补充&＃xff1a;

代码中生成器使用了LeakyReLU激活函数&＃xff0c;鉴别器使用了ReLU激活函数。两者区别如下&＃xff1a;

LeakyReLU激活函数是ReLU的变体&＃xff0c;其表达式为&＃xff1a;

$y_{i}&＃61;\left\{\begin{matrix} x_{i} , x_{i} \geqslant 0& \\ \frac{x_{i}}{a_{i}} , x_{i}<0 & \end{matrix}\right.$ def train(d, g, criterion, d_optimizer, g_optimizer, epochs&＃61;1, show_every&＃61;1000, print_every&＃61;10):iter_count &＃61; 0for epoch in range(epochs):for inputs, _ in train_loader:real_inputs &＃61; inputs # 真实样本fake_inputs &＃61; g(torch.randn(5, 100)) # 伪造样本real_labels &＃61; torch.ones(real_inputs.size(0)) # 真实标签fake_labels &＃61; torch.zeros(5) # 伪造标签real_outputs &＃61; d(real_inputs)d_loss_real &＃61; criterion(real_outputs, real_labels)fake_outputs &＃61; d(fake_inputs)d_loss_fake &＃61; criterion(fake_outputs, fake_labels)d_loss &＃61; d_loss_real &＃43; d_loss_faked_optimizer.zero_grad()d_loss.backward()d_optimizer.step()fake_inputs &＃61; g(torch.randn(5, 100))outputs &＃61; d(fake_inputs)real_labels &＃61; torch.ones(outputs.size(0))g_loss &＃61; criterion(outputs, real_labels)g_optimizer.zero_grad()g_loss.backward()g_optimizer.step()if (iter_count % show_every &＃61;&＃61; 0):print(&＃39;Epoch:{}, Iter:{}, D:{.4}, G:{.4}&＃39;.format(epoch,iter_count,d_loss.item(),g_loss.item()))picname &＃61; "Epoch_" &＃43; str(epoch) &＃43; "Iter_" &＃43; str(iter_count)img_show(torchvision.utils.make_grid(fake_inputs.data), picname)if (iter_count % print_every &＃61;&＃61; 0):print(&＃39;Epoch:{}, Iter:{}, D:{.4}, G:{.4}&＃39;.format(epoch,iter_count,d_loss.item(),g_loss.item()))iter_count &＃43;&＃61; 1print(&＃39;Finished Training&＃xff01;&＃39;)# 主程序
if __name__ &＃61;&＃61; &＃39;__main__&＃39;:# 串联多个变换操作data_transform &＃61; transforms.Compose([transforms.RandomHorizontalFlip(), # 依概率p水平翻转&＃xff0c;默认p&＃61;0.5transforms.ToTensor(), # 转为tensor&＃xff0c;并归一化至[0-1]# 标准化&＃xff0c;把[0-1]变换到[-1,1]&＃xff0c;其中mean和std分别通过(0.5,0.5,0.5)和(0.5,0.5,0.5)进行指定。# 原来的[0-1]最小值0变成(0-0.5)/0.5&＃61;-1&＃xff0c;最大值1变成(1-0.5)/0.5&＃61;1transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])])# 参数data_transform&＃xff1a;对图片进行预处理的操作&＃xff08;函数&＃xff09;&＃xff0c;原始图片作为输入&＃xff0c;返回一个转换后的图片。train_set &＃61; datasets.ImageFolder(&＃39;imgs&＃39;, data_transform)train_loader &＃61; torch.utils.data.DataLoader(train_set, batch_size&＃61;5,shuffle&＃61;True, num_workers&＃61;4) # 数据加载inputs, _ &＃61; next(iter(train_loader))# make_grid的作用是将若干幅图像拼成一幅图像img_show(torchvision.utils.make_grid(inputs), "RealDataSample")# 初始化鉴别器和生成器d &＃61; Discriminator(3, 32)g &＃61; Generator(3, 128, 1024, 100)criterion &＃61; nn.BCELoss() # 损失函数lr &＃61; 0.0003 # 学习率d_optimizer &＃61; torch.optim.Adam(d.parameters(), lr&＃61;lr) # 定义鉴别器的优化器g_optimizer &＃61; torch.optim.Adam(g.parameters(), lr&＃61;lr) # 定义生成器的优化器# 训练train(d, g, criterion, d_optimizer, g_optimizer, epochs&＃61;300)

参考链接及书目
Pytorch深度学习入门--曾芃壹
https://zhuanlan.zhihu.com/p/24767059
https://blog.csdn.net/qq_38410428/article/details/94719553
https://www.baidu.com/link?url&＃61;WFl0YU3KyqRVxEK6sEclXW5Rrj7mEWaJ3hJR4VPKbB1RYP8R1My2a41FcxAEiBNW2D1mftNaXPEWM0_jDToXIW2usQVDbT60Jxs3kwWBYk7&wd&＃61;&eqid&＃61;a730217300106c0100000006610b3d6c

推荐阅读

jsp
22.Container With Most Water（能装最多水的容器）

thecontainercontainsthemos ... [详细]

蜡笔小新 2024-09-30 18:33:10
python
以下不是python文件读写方法的是Python 文件I/O

Python文件IO本章只讲述所有基本的IO函数，更多函数请参考Python标准文档。打印到屏幕最简单的输出方法是用print语句，你可以给它传递 ... [详细]

蜡笔小新 2024-09-30 14:49:29
python
python元类、反射及双线方法

元类print(type(abc))print(type(True))print(type(100))print(type([1,2,3]))print(type({na ... [详细]

蜡笔小新 2024-09-30 10:42:20
python
JavaMail的常用类(Session,Transport,MimeMessage,Address,Store,Folder,Multipart)

(一)javax.mail.Session:Session类代表JavaMail中的一次邮件会话.每个基于JavaMail的应用程序至少有一次会话,也可以产生多次会话.发送邮件之前 ... [详细]

蜡笔小新 2024-09-30 09:50:10
request
FluxCD、ArgoCD或Jenkins X，哪个才是适合你的GitOps工具？

GitOps是一种使用基于Git的工作流程来全面管理应用和基础设施的想法，其在最近获得了极大关注。新一代的部署工具更能说明这一点，它们将GitOps作为 ... [详细]

蜡笔小新 2024-09-29 19:04:37
io
java播放mp3格式音乐_java播放mp3格式音频文件

下载完成之后解压提取jl1.0.0.1.jar这里写图片描述将jl1.0.0.1.jar拷贝到项目中，并添加到Library这里写图片描述4.源代码Tip:由于工程名 ... [详细]

蜡笔小新 2024-09-29 17:28:42
runtime
零入门kubernetes网络实战15＞基于golang编程实现给ns网络命名空间添加额外的网卡

《零入门kubernetes网络实战》视频专栏地址https:www.ixigua.com7193641905282875942本篇文章视频地址(稍后上传)本篇文章主要是想通过g ... [详细]

蜡笔小新 2024-09-27 16:47:20
python
大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型：complex布尔型:bool2.字符串字符串：String3.与 ... [详细]

蜡笔小新 2024-09-26 12:44:43
python
python绘图设置正交坐标等距_Python:线性代数机器学习背后的优化原理 (五十五)...

线性代数：机器学习背后的优化原理线性代数作为数学的一个分支，广泛应用于科学和工程中，掌握好线性代数对于理解和从事机器学习算法相关工作是很有 ... [详细]

蜡笔小新 2024-09-26 10:09:12
sum
Go 语言入门很简单 Go 加密和解密 #私藏项目实操分享#

介绍项目开发过程中，一个不可避免的问题就是密码安全问题。实际上，我们经常能看到很多新闻的密码泄露事件，很多传统的企业密码采用明文存储&#x ... [详细]

蜡笔小新 2024-09-24 17:50:04
require
Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法

本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数，可以设置密码的有效期、最小间隔时间、最小长度，并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]

蜡笔小新 2023-12-14 17:57:01
io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
python
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
io
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
less
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11

繁華落盡灬熙

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章