热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

基于PyTorch,如何构建一个简单的神经网络

本文为PyTorch官方教程中:如何构建神经网络。基于PyTorch专门构建神经网络的子模块torch.nn构建一个简单的神经网络。完整教程运行codelab→htt

本文为 PyTorch 官方教程中:如何构建神经网络。基于 PyTorch 专门构建神经网络的子模块 torch.nn 构建一个简单的神经网络。

完整教程运行 codelab→

https://openbayes.com/console/open-tutorials/containers/OgcYkLjKw89

torch.nn 文档→

https://pytorch.org/docs/stable/nn.html

神经网络由对数据执行操作的层/模块组成。torch.nn 提供了构建神经网络所需的所有模块。

PyTorch 中的每个模块都是 nn.module 的子类。

在下面的部分中,我们将构建一个神经网络来进行10种类别的分类。

建立神经网络

神经网络由对数据执行操作的层/模块组成。torch.nn 提供了构建神经网络所需的所有模块。PyTorch 中的每个模块都是 nn.module 的子类。

在下面的部分中,我们将构建一个神经网络来进行10种类别的分类。

import osimport torchfrom torch import nnfrom torch.utils.data import DataLoaderfrom torchvision import datasets, transforms

加载训练设备

我们希望能够在硬件加速器,比如 GPU 上训练我们的模型。可以通过 torch.cuda 来检测 GPU 是否可用。

device = 'cuda' if torch.cuda.is_available() else 'cpu' #检测gpu是否可用,不可用使用cpuprint('Using {} device'.format(device)) #输出使用设备类型

定义类

我们通过 nn.Module 来定义神经网络,并在__init__ 中初始化神经网络。每个 nn.Module 子类在 forward 方法中实现对输入数据的操作。

class NeuralNetwork(nn.Module):    def __init__(self): #定义网络结构        super(NeuralNetwork, self).__init__()        self.flatten = nn.Flatten()        self.linear_relu_stack = nn.Sequential(            nn.Linear(28*28, 512),            nn.ReLU(),            nn.Linear(512, 512),            nn.ReLU(),            nn.Linear(512, 10),            nn.ReLU()        )def forward(self, x): #前向传播        x = self.flatten(x)        logits = self.linear_relu_stack(x)        return logits

在使用模型前需要先实例化模型,并将其移动到 GPU 上

model = NeuralNetwork().to(device) #实例化模型print(model)

为了在模型的输入和输出之间创建复杂的非线性映射,需要使用非线性的激活函数。

它们在线性变换后引入非线性,帮助神经网络学习各种各样的复杂映射。在这个模型中,我们在线性层之间使用 nn.ReLU,也可以使用其他激活函数来引入非线性。

X = torch.rand(1, 28, 28, device=device)  #生成(1,28,28)的数据logits = model(X) #向模型输入数据pred_probab = nn.Softmax(dim=1)(logits) #调用softmax 将预测值映射为(0,1)间的概率y_pred = pred_probab.argmax(1) #最大概率对应分类print(f"Predicted class: {y_pred}")

神经网络各层说明

接下来,我们分解网络来具体讲述每一层的功能。

为了说明这一点,我们将取小批量的3个尺寸为28x28的图像样本输入网络

input_image = torch.rand(3,28,28) #生成(3,28,28)的数据print(input_image.size())

nn.Flatten 层

Flatten 层用来把多维的输入一维化,常用在从卷积层到全连接层的过渡。

nn.Flatten 层,可以将每个 28x28 图像转换 784 ($28\times 28=784$)个像素值的连续数组(批量维度保持为3)。 

flatten = nn.Flatten() flat_image = flatten(input_image) #(3,28,28)转换为(3,784)print(flat_image.size())

nn.Linear 层

nn.Linear 层,即线性层,是一个使用权重和偏差对输入数据作线性变换的模块。

layer1 = nn.Linear(in_features=28*28, out_features=20) #输入(3,28*28) 输出(3,20)hidden1 = layer1(flat_image)print(hidden1.size())

nn.ReLU 层

为了在模型的输入和输出之间创建复杂的非线性映射,需要使用非线性的激活函数。它们在线性变换后引入非线性,帮助神经网络学习各种各样的复杂映射。

在这个模型中,我们在线性层之间使用 nn.ReLU,也可以使用其他激活函数来引入非线性。

print(f"Before ReLU: {hidden1}\n\n")hidden1 = nn.ReLU()(hidden1)print(f"After ReLU: {hidden1}")

nn.Sequential 层

神经网络的最后一个线性层返回 logits,即值域区间在$[-\infty,\infty]$中的原始值。这些值传递给nn.Softmax模块后,logit被缩放为$[0,1]$区间中,表示模型对每个类的预测概率。

dim参数表示每一维度进行运算的位置,运算结果相加为1。

softmax = nn.Softmax(dim=1)pred_probab = softmax(logits)

输出模型结构

神经网络中的许多层都是参数化的,即具有相关联的权重和偏差,这些参数在训练中被迭代优化。

子类 nn.Module 自动跟踪模型对象内部定义的所有字段,并使用模型的 parameters() 或 named_parameters() 方法访问所有参数。

我们可以通过模型迭代每个参数,并输出其尺寸和值。

print("Model structure: ", model, "\n\n")
for name, param in model.named_parameters():    print(f"Layer: {name} | Size: {param.size()} | Values : {param[:2]} \n")

最终输出结果可访问完整教程:

https://openbayes.com/console/open-tutorials/containers/OgcYkLjKw89



推荐阅读
  • 保姆级使用PyTorch训练与评估自己的HorNet网络教程
    文章目录前言0.环境搭建&快速开始1.数据集制作1.1标签文件制作1.2数据集划分1.3数据集信息文件制作2.修改参数文件3.训练4.评估5.其他教程前言项目地址: ... [详细]
  • 各个组件confspark-env.sh配置spark的环境变量confspark-default.conf配置spark应用默认的配置项和spark-env.sh有重合之处,可在 ... [详细]
  • DNNBrain:北师大团队出品,国内首款用于映射深层神经网络到大脑的统一工具箱...
    导读深度神经网络(DNN)通过端到端的深度学习策略在许多具有挑战性的任务上达到了人类水平的性能。深度学习产生了具有多层抽象层次的数据表示;然而,它没有明确地提供任何关 ... [详细]
  • Sets和数组一样,都是一些有序值的的集合,但是Sets和数组又有所不同,首先Sets集合中不能存有相同的值,如果你向Set ... [详细]
  • 原文链接https://www.cnblogs.com/zhouzhendong/p/9161514.html ... [详细]
  • 局限性_Scrum框架的局限性
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Scrum框架的局限性相关的知识,希望对你有一定的参考价值。在很多工作坊的讨论中, ... [详细]
  • 题目大意题目原文:http:uva.onlinejudge.orgexternal10410474.pdf背景还是基本的排序问题,题目意思很简单就是首先 ... [详细]
  • 技术点:1、通过已知的网页路径获得流2、把流转换成字节数组3、把字节数组转换成String字符串显示在TextView控件中一、获得流publicstaticSt ... [详细]
  • 3357: [Usaco2004]等差数列
    3357:[Usaco2004]等差数列TimeLimit:10SecMemoryLimit:128MBSubmit:321Solved:153[Submit][Status][D ... [详细]
  • [二分图]JZOJ 4612 游戏
    DescriptionInputOutputSampleInput44#****#****#*xxx#SampleOutput5DataConstraint分析非常眼熟࿰ ... [详细]
  • selenium 定位方式3css_selector
    关于页面元素定位,可以根据id、class、name属性以及link_text。其中id属性是最理想的定位方式,class与name属性, ... [详细]
  • 开发笔记:js正则表达式属性及方法的使用
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了js正则表达式属性及方法的使用相关的知识,希望对你有一定的参考价值。正则表达式直接量 ... [详细]
  • springboot系列(二)创建springboot工程
    https:www.cnblogs.commagicalSamp7171716.html简介SpringBoot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spri ... [详细]
  • 史上最全的Websocket入门教程
    websocket是什么?答:它是一种网络通信协议,是HTML5开始提供的一种在单个TCP连接上进行全双工通讯的协议。为什么需要websocket?疑问?我 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
author-avatar
Melody-Zhu1988
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有