当前位置: 开发笔记 > 编程语言 > 正文

pytorch矩阵相乘_PyTorch基础Part1

作者：孙孟兰_580 | 来源：互联网 | 2023-08-18 18:51

本文主要内容：1.Pytorch变量的基础操作2.Pytorch前向反馈网络的构建3.试着跑了一下Pytorch前往网络的反馈基础之从0开始什么是PyTorch构建和

本文主要内容&＃xff1a;

1. Pytorch变量的基础操作
2. Pytorch前向反馈网络的构建
3. 试着跑了一下Pytorch前往网络的反馈

基础之从0开始

什么是PyTorch

构建和训练神经网络的框架&＃xff0c;PyTorch在很多方面用起来和Numpy差不多&＃xff0c;但是可以把PyTorch的张量扔进GPUs里训练。

从神经网络说起

深度学习是建立在神经网络上的。总体来说就是N多个神经元通过一个个门&＃xff0c;激活函数&＃xff0c;经过各种线性变换后可以拟合出非常好的结果。数学表达上来说&＃xff0c;一个单层&＃xff0c;单门&＃xff0c;单激活函数的神经网络的数学表达就是这样的&＃xff1a;

向量化表达

以后打算专门再写一下反向传播&＃xff0c;下面两个视频我之前看了觉得对理解这块非常有帮助NerualNetWorkP1NerualNetWorkP2

import torch import numpy as npdef activation(x):# 记住Torch对于数组的操作形式和Numpy真的差不多return 1 / (1 &＃43; torch.exp(-x))np.exp([1,2,3]) # array([ 2.71828183, 7.3890561 , 20.08553692]) torch.exp(torch.arange(0.,4)) # 这里要加个逗号&＃xff0c;因为exp方法不支持long变量 # tensor([ 1.0000, 2.7183, 7.3891, 20.0855])torch.manual_seed(7)features &＃61; torch.randn((1,5)) weights &＃61; torch.rand_like(features) bias &＃61; torch.rand((1,1))

上面的式子创建了单个神经元的基础构成&＃xff0c;5个特征&＃xff0c;5个权重&＃xff0c;一个偏置项。
- torch.randn()函数构建一个1行5列的Tensor
- torch.randn_like(Tensor2)构建一个与input tensor形状一样的tensor
- torch.randn()从一个正太分布中创建单个值.
PyTorch构建出来的Tensor基本都可以和Numpy的array一样加减乘除操作,only it supports GPU。
现在我们来尝试把刚刚构建的模型输入相加.

y &＃61; activation(torch.sum( features * weights ) &＃43; bias # or just (features*weights).sum() &＃43; bias) print(y)tensor([[0.8072]])

刚刚的结果其实是点乘&＃xff0c;实际在在矩阵操作时我们都会使用矩阵相乘&＃xff0c;这时可以用torch.mm或者torch.matmul函数不过需要注意的是&＃xff0c;矩阵相称需要保证 (n*m) * (m * q) 的性质
所以我们如果要对刚刚的特征和矩阵相乘&＃xff0c;就要改变weights的shape,pytorch提供了下面3个接口&＃xff1a;
weights.reshape(a,b)返回一个新的a,b矩阵&＃xff08;有时会改变原Tensor)位置
weights.resize_(a,b)就地改变&＃xff0c;返回同一个tensor&＃xff0c;这个函数如果a,b与原矩阵形状不同的话&＃xff0c;会造成信息丢失。
weight.view(a,b) 教程上说这个是最好的&＃xff0c;返回一个形状为a,b的Tensor
那么接下来就用真正的矩阵乘法&＃xff0c;输出我们上一个神经元的结果&＃xff01;

activation(torch.mm(features,weights.view(5,-1)) &＃43; bias)tensor([[0.8072]])

神经元的组合

上面的例子非常简单的说明了对于单一的神经元来说&＃xff0c;神经网络是怎么进行计算的。实际上在真正的深度学习中&＃xff0c;我们往往多多层&＃xff0c;多个神经网络组合形成一个学习网络。第一层我们往往叫做输入层&＃xff08;特征进来&＃xff09;&＃xff0c;中间的层叫隐层&＃xff0c;输出结果的叫做输出层。如果用数学符号来表示的话&＃xff0c;是这样的&＃xff08;假设我们有一个3个单元的输入层&＃xff0c;2个单元的隐层&＃xff0c;一个输出层&＃xff09;

可以进一步简化表达成&＃xff1a;

让我们用代码来表达一下这个神经网络

torch.manual_seed(7)features &＃61; torch.randn((1, 3)) n_input &＃61; features.shape[1] n_hidden &＃61; 2 n_output &＃61; 1 # 第一层的权重 W1 &＃61; torch.randn(n_input,n_hidden) # 第二层的权重 W2 &＃61; torch.randn(n_hidden,n_output) # 两层的偏置项 B1 &＃61; torch.randn(1,n_hidden) B2 &＃61; torch.randn(1,n_output)

接下来计算一下2层的结果输出

h &＃61; activation(torch.mm(features,W1) &＃43; B1) output &＃61; activation(torch.mm(h,W2) &＃43; B2) print(output)tensor([[0.3171]])

基础篇总结&＃xff1a;

Torch操作方式和Numpy差不多&＃xff08;不过记得要类型转换的时候记得要转成float&＃xff0c;Torch转Long会报错&＃xff09;
矩阵相乘的行列数字一定要对准

开始构建第一个神经网络

例子非常简单&＃xff0c;接下来我们开始玩Pytorch界的IrisDataSet --> MNIST 也就是辨识手写数字。
这个数据集中的所有数据像素都是28*28的&＃xff0c;我们可以通过torchvision把这个数据下载下来

import numpy as np import torch import matplotlib.pyplot as plt %matplotlib inline %config InlineBackend.figure_format &＃61; &＃39;retina&＃39; from torchvision import datasets, transforms transform &＃61; transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,)),]) trainset &＃61; datasets.MNIST(&＃39;~/.pytorch/MNIST_data/&＃39;, train&＃61;True, transform&＃61;transform) trainloader &＃61; torch.utils.data.DataLoader(trainset, batch_size&＃61;64, shuffle&＃61;True)

可以看到我们把数据读进了一个叫trainloader的东西&＃xff0c;这个工具的作用是把我们的训练集合变成一个batch_size为64张图的迭代器&＃xff0c;Shuffle代表每次load的时候打乱突变的顺序。我们可以尝试看一下数据大概长什么样子

dataiter &＃61; iter(trainloader) images, labels &＃61; dataiter.next() print(type(images)) print(images.shape) print(labels.shape) torch.Size([64, 1, 28, 28]) torch.Size([64]plt.imshow(images[0].numpy().squeeze())

在全连接的神经网络中&＃xff0c;输入层是一个n行1列的向量&＃xff0c;也就是说我们需要把表达图片的二维矩阵改成一维向量.
另外之前的例子我们的输出层只有一个节点&＃xff0c;为了区分数字我们要有10个输出节点&＃xff08;10个概率值&＃xff1f;交叉熵&＃xff1f;SoftMax有没有&＃xff1f;&＃xff09;

让我们开始构建这个网络

inputs &＃61; images.view(images.shape[0],-1) w1 &＃61; torch.randn(784, 256) b1 &＃61; torch.randn(256)w2 &＃61; torch.randn(256, 10) b2 &＃61; torch.randn(10) h &＃61; activation(torch.mm(inputs, w1) &＃43; b1) out &＃61; torch.mm(h, w2) &＃43; b2

为了评估输出的十个数据中&＃xff0c;哪个才是概率最高的预测指作为我们的输出&＃xff0c;我们使用SoftMax。SoftMax的公式长这样
下面的函数中的torch.exp(x),dim&＃61;1参数说明了对于哪个维度去进行求和计算&＃xff0c;由于我们的softmax是针对每一行的概率值求和&＃xff0c;所以需要取第一个&＃xff0c;view(-1,1) 将结果从1行64列转为64列一行&＃xff0c;方便对没行进行softmax概率计算

建议需要脑补两个向量互相作用&＃xff0c;比较好理解

def softmax(x):return torch.exp(x) / torch.sum(torch.exp(x), dim&＃61;1).view(-1,1) probabilities &＃61; softmax(out)# Does it have the right shape? Should be (64, 10) print(probabilities.shape) # Does it sum to 1? print(probabilities.sum(dim&＃61;1))torch.Size([64, 10]) tensor([1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000,1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000,1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000,1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000,1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000,1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000,1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000, 1.0000,1.0000])

开始构建神经网络

接下里使用PyTorch的nn模块进行网络构建。我们将构建一个输入784维&＃xff0c;隐含层256维&＃xff0c;10维度输出层的网络&＃xff0c;并且结合softmax输出3.

from torch import nn class NetWork(nn.Module):def __init__(self):# 当需要继承父类构造函数中的内容# 且子类需要在父类的基础上补充时&＃xff0c;使用super().__init__()super().__init__() # 定义隐层&＃xff08;输入维度&＃xff0c;输出维度&＃xff09;self.hidden &＃61; nn.Linear(784,256)self.output &＃61; nn.Linear(256,10)# 定义激活函数self.sigmoid &＃61; nn.Sigmoid()self.softmax &＃61; nn.Softmax(1)def forward(self,x):# 定义前向反馈传播路径&＃xff0c;x是输入向量&＃xff0c;一层层的经过网络的洗礼x &＃61; self.hidden(x)x &＃61; self.sigmoid(x)x &＃61; self.output(x)x &＃61; self.softmax(x)return xmodel &＃61; NetWork() modelNetWork((hidden): Linear(in_features&＃61;784, out_features&＃61;256, bias&＃61;True)(output): Linear(in_features&＃61;256, out_features&＃61;10, bias&＃61;True)(sigmoid): Sigmoid()(softmax): Softmax(dim&＃61;1) )

我们也可以使用torch.nn.functional更简洁明了的定义网络。一般这种方式会比较常用

import torch.nn.functional as Fclass Network(nn.Module):def __init__(self):super().__init()self.hidden &＃61; nn.Linear(784,256)self.output &＃61; nn.Linear(256,10)def forward(self,x):x &＃61; F.sigmoid(self.hidden(x))x &＃61; F.softmax(self.output(x),dim&＃61;1)return x

选择激活函数

除了Softmax作为激活函数外&＃xff0c;还有非常熟悉的Sigmoid函数&＃xff0c;Tanh&＃xff0c;和Relu都可以作为激活函数.&＃xff08;不过Relu赛高&＃xff0c;因为Sigmoid的梯度在预测值较大&＃xff0c;导致非常接近两端的时候&＃xff0c;梯度很小&＃xff0c;模型学习能力会受到很大的限制&＃xff09; 我们可以分别给激活函数画个图

x &＃61; np.arange(-15,15) sigmoid &＃61; 1/(1&＃43;np.exp(-x)) tanh &＃61; 2/(1&＃43;np.exp(-2*x)) -1 relu &＃61; [i if i >&＃61;0 else 0 for i in x]fig,axes &＃61; plt.subplots(1,3,figsize&＃61;(30,7)) for ax,line,name in zip(axes,[sigmoid,tanh,relu],[&＃39;sigmoid&＃39;,&＃39;tanh&＃39;,&＃39;relu&＃39;]):ax.plot(x,line,lw&＃61;4)ax.set_title(name,fontsize&＃61;30,weight&＃61;&＃39;bold&＃39;)

选好了激活函数&＃xff0c;开始燥吧&＃xff01;¶

根据晚上的教程&＃xff0c;我们将构造一个784-128-64-10的神经网络&＃xff0c;这一次我们加入激活函数

## Solutionclass Network(nn.Module):def __init__(self):super().__init__()# Defining the layers, 128, 64, 10 units eachself.fc1 &＃61; nn.Linear(784, 128)self.fc2 &＃61; nn.Linear(128, 64)# Output layer, 10 units - one for each digitself.fc3 &＃61; nn.Linear(64, 10)def forward(self, x):&＃39;&＃39;&＃39; Forward pass through the network, returns the output logits &＃39;&＃39;&＃39;x &＃61; self.fc1(x)x &＃61; F.relu(x)x &＃61; self.fc2(x)x &＃61; F.relu(x)x &＃61; self.fc3(x)x &＃61; F.softmax(x, dim&＃61;1)return xmodel &＃61; Network() model Network((fc1): Linear(in_features&＃61;784, out_features&＃61;128, bias&＃61;True)(fc2): Linear(in_features&＃61;128, out_features&＃61;64, bias&＃61;True)(fc3): Linear(in_features&＃61;64, out_features&＃61;10, bias&＃61;True) )

初始化权重和偏置项

Pytorch会自动为我们设置权重。但有些时候我们也会需要自己去定义初始权重.我们可以通过model.fcx.weight来访问网络的这些属性.

model.fc1.weight.shape torch.Size([128, 784])model.fc1.bias.shape torch.Size([128])model.fc1.bias.data.fill_(0) tensor([0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,0., 0., 0., 0., 0., 0., 0., 0.])model.fc1.weight.data.normal_(std&＃61;0.01) tensor([[-0.0003, 0.0107, -0.0265, ..., -0.0097, 0.0048, -0.0024],[-0.0157, 0.0112, 0.0066, ..., -0.0172, -0.0062, 0.0107],[ 0.0022, 0.0017, -0.0013, ..., 0.0011, 0.0143, -0.0131],...,[ 0.0018, -0.0082, -0.0011, ..., -0.0071, -0.0085, 0.0081],[-0.0009, -0.0019, 0.0004, ..., -0.0051, 0.0110, 0.0013],[-0.0075, -0.0198, 0.0041, ..., -0.0231, -0.0113, 0.0050]])

前向传播

构建完了网络&＃xff0c;接下来我们让他往前跑起来&＃xff01;

dataiter &＃61; iter(trainloader) images, labels &＃61; dataiter.next()# Resize images into a 1D vector, new shape is (batch size, color channels, image pixels) images.resize_(64, 1, 784)s img_idx &＃61; 0 ps &＃61; model.forward(images[img_idx,:])

使用`nn.Sequential` 构建模型

我真的不懂为啥要有那么多方式构建模型.....

input_size &＃61; 784 hidden_sizes &＃61; [128, 64] output_size &＃61; 10model &＃61; nn.Sequential(nn.Linear(input_size, hidden_sizes[0]),nn.ReLU(),nn.Linear(hidden_sizes[0], hidden_sizes[1]),nn.ReLU(),nn.Linear(hidden_sizes[1], output_size),nn.Softmax(dim&＃61;1)) print(model) Sequential((0): Linear(in_features&＃61;784, out_features&＃61;128, bias&＃61;True)(1): ReLU()(2): Linear(in_features&＃61;128, out_features&＃61;64, bias&＃61;True)(3): ReLU()(4): Linear(in_features&＃61;64, out_features&＃61;10, bias&＃61;True)(5): Softmax() )images, labels &＃61; next(iter(trainloader)) images.resize_(images.shape[0], 1, 784) ps &＃61; model.forward(images[0,:])

也可以传入字典来构建PyTorch模型&＃xff08;这样子可以直接通过名字access模型对应矩阵层&＃xff09;

from collections import OrderedDictmodel &＃61; nn.Sequential(OrderedDict([(&＃39;fc1&＃39;, nn.Linear(input_size, hidden_sizes[0])),(&＃39;relu1&＃39;, nn.ReLU()),(&＃39;fc2&＃39;, nn.Linear(hidden_sizes[0], hidden_sizes[1])),(&＃39;relu2&＃39;, nn.ReLU()),(&＃39;output&＃39;, nn.Linear(hidden_sizes[1], output_size)),(&＃39;softmax&＃39;, nn.Softmax(dim&＃61;1))])) modelSequential((fc1): Linear(in_features&＃61;784, out_features&＃61;128, bias&＃61;True)(relu1): ReLU()(fc2): Linear(in_features&＃61;128, out_features&＃61;64, bias&＃61;True)(relu2): ReLU()(output): Linear(in_features&＃61;64, out_features&＃61;10, bias&＃61;True)(softmax): Softmax() )

试试访问

print(model[0]) print(model.fc1)Linear(in_features&＃61;784, out_features&＃61;128, bias&＃61;True) Linear(in_features&＃61;784, out_features&＃61;128, bias&＃61;True)

推荐阅读

import
python绘图设置正交坐标等距_Python:线性代数机器学习背后的优化原理 (五十五)...

线性代数：机器学习背后的优化原理线性代数作为数学的一个分支，广泛应用于科学和工程中，掌握好线性代数对于理解和从事机器学习算法相关工作是很有 ... [详细]

蜡笔小新 2024-09-26 10:09:12
list
文本生成图像简要回顾 text to image synthesis

摘要文本生成图像作为近几年的热门研究领域，其解决的问题是从一句描述性文本生成与之对应的图片。近一周来，我通过阅读了近几年发表于顶会的近10篇论文，做出本文中对该方向的 ... [详细]

蜡笔小新 2024-09-29 11:02:00
import
大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型：complex布尔型:bool2.字符串字符串：String3.与 ... [详细]

蜡笔小新 2024-09-26 12:44:43
const
深度强化学习Policy Gradient基本实现

全文共2543个字，2张图，预计阅读时间15分钟。基于值的强化学习算法的基本思想是根据当前的状态，计算采取每个动作的价值，然 ... [详细]

蜡笔小新 2024-09-25 17:01:10
import
logistic回归（线性和非线性）的开发笔记

本文由编程笔记#小编为大家整理，主要介绍了logistic回归（线性和非线性）相关的知识，包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 21:40:43
import
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
import
以下不是python文件读写方法的是Python 文件I/O

Python文件IO本章只讲述所有基本的IO函数，更多函数请参考Python标准文档。打印到屏幕最简单的输出方法是用print语句，你可以给它传递 ... [详细]

蜡笔小新 2024-09-30 14:49:29
jar
每日一书丨AI圣经《深度学习》作者斩获2018年图灵奖

2019年3月27日——ACM宣布，深度学习之父YoshuaBengio,YannLeCun,以及GeoffreyHinton获得了2018年的图灵奖， ... [详细]

蜡笔小新 2024-09-27 16:03:32
import
SciKitLearn标签编码器导致错误“参数必须是字符串或数字”

我有点困惑-在这里创建ML模型。我正在尝试从“大”数据框（180列）中获 ... [详细]

蜡笔小新 2024-09-26 18:39:21
import
DNNBrain：北师大团队出品，国内首款用于映射深层神经网络到大脑的统一工具箱...

导读深度神经网络(DNN)通过端到端的深度学习策略在许多具有挑战性的任务上达到了人类水平的性能。深度学习产生了具有多层抽象层次的数据表示;然而，它没有明确地提供任何关 ... [详细]

蜡笔小新 2024-09-26 12:34:26
import
系数|量纲_机器学习基础一文带你用sklearn做特征工程

篇首语：本文由编程笔记#小编为大家整理，主要介绍了机器学习基础一文带你用sklearn做特征工程相关的知识，希望对你有一定的参考价值。使用sklearn做特 ... [详细]

蜡笔小新 2024-09-26 05:57:01
list
turn page

NGUIusingSystem;usingUnityEng ... [详细]

蜡笔小新 2024-09-25 15:16:38
sum
One Stage目标检测

在计算机视觉中，目标检测是一个难题。在大型项目中，首先需要先进行目标检测，得到对应类别和坐标后，才进行之后的各种分析。如人脸识别，通常是首先人脸检测，得到人脸的目标框，再对此目标框 ... [详细]

蜡笔小新 2024-09-25 10:55:17
sum
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
ip
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18