【偷偷卷死小伙伴Pytorch20天day06自动微分机制】

作者：在海那边A-P | 来源：互联网 | 2023-09-09 14:51

神经网络通常依赖反向传播求梯度来更新网络参数，求梯度过程通常是一件非常复杂而容易出错的事情。而深度学习框架可以帮助我们自动地完成这种求梯度运算。Pytorch一般通过

神经网络通常依赖反向传播求梯度来更新网络参数&＃xff0c;求梯度过程通常是一件非常复杂而容易出错的事情。而深度学习框架可以帮助我们自动地完成这种求梯度运算。 Pytorch一般通过反向传播 backward 方法实现这种求梯度计算。该方法求得的梯度将存在对应自变量张量的grad属性下。除此之外&＃xff0c;也能够调用torch.autograd.grad 函数来实现求梯度计算。这就是Pytorch的自动微分机制。

一、利用backward方法求导数

backward 方法通常在一个标量张量上调用&＃xff0c;该方法求得的梯度将存在对应自变量张量的grad属性下。

如果调用的张量非标量&＃xff0c;则要传入一个和它同形状的gradient参数张量。

相当于用该gradient参数张量与调用张量作向量点乘&＃xff0c;得到的标量结果再反向传播。

1.标量的反向传播

import numpy as np import torch # f(x) &＃61; a*x**2 &＃43; b*x &＃43; c的导数x &＃61; torch.tensor(0.0,requires_grad &＃61; True) # x需要被求导 a &＃61; torch.tensor(1.0) b &＃61; torch.tensor(-2.0) c &＃61; torch.tensor(1.0) y &＃61; a*torch.pow(x,2) &＃43; b*x &＃43; c y.backward() dy_dx &＃61; x.grad print(dy_dx)

在这里插入图片描述

2. 非标量的反向传播

import numpy as np import torch # f(x) &＃61; a*x**2 &＃43; b*x &＃43; cx &＃61; torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad &＃61; True) # x需要被求导 a &＃61; torch.tensor(1.0) b &＃61; torch.tensor(-2.0) c &＃61; torch.tensor(1.0) y &＃61; a*torch.pow(x,2) &＃43; b*x &＃43; c gradient &＃61; torch.tensor([[1.0,1.0],[1.0,1.0]])print("x:\n",x) print("y:\n",y) y.backward(gradient &＃61; gradient) x_grad &＃61; x.grad print("x_grad:\n",x_grad)

在这里插入图片描述

3.非标量的反向传播可以用标量的反向传播实现

import numpy as np import torch # f(x) &＃61; a*x**2 &＃43; b*x &＃43; cx &＃61; torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad &＃61; True) # x需要被求导 a &＃61; torch.tensor(1.0) b &＃61; torch.tensor(-2.0) c &＃61; torch.tensor(1.0) y &＃61; a*torch.pow(x,2) &＃43; b*x &＃43; c gradient &＃61; torch.tensor([[1.0,1.0],[1.0,1.0]]) z &＃61; torch.sum(y*gradient)print("x:",x) print("y:",y) z.backward() x_grad &＃61; x.grad print("x_grad:\n",x_grad)

在这里插入图片描述

二、利用autograd.grad方法求导数

import numpy as np import torch # f(x) &＃61; a*x**2 &＃43; b*x &＃43; c的导数x &＃61; torch.tensor(0.0,requires_grad &＃61; True) # x需要被求导 a &＃61; torch.tensor(1.0) b &＃61; torch.tensor(-2.0) c &＃61; torch.tensor(1.0) y &＃61; a*torch.pow(x,2) &＃43; b*x &＃43; c# create_graph 设置为 True 将允许创建更高阶的导数 dy_dx &＃61; torch.autograd.grad(y,x,create_graph&＃61;True)[0] print(dy_dx.data)# 求二阶导数 dy2_dx2 &＃61; torch.autograd.grad(dy_dx,x)[0] print(dy2_dx2.data)

在这里插入图片描述

import numpy as np import torch x1 &＃61; torch.tensor(1.0,requires_grad &＃61; True) # x需要被求导 x2 &＃61; torch.tensor(2.0,requires_grad &＃61; True)y1 &＃61; x1*x2 y2 &＃61; x1&＃43;x2# 允许同时对多个自变量求导数 (dy1_dx1,dy1_dx2) &＃61; torch.autograd.grad(outputs&＃61;y1,inputs &＃61; [x1,x2],retain_graph &＃61; True) print(dy1_dx1,dy1_dx2)# 如果有多个因变量&＃xff0c;相当于把多个因变量的梯度结果求和 (dy12_dx1,dy12_dx2) &＃61; torch.autograd.grad(outputs&＃61;[y1,y2],inputs &＃61; [x1,x2]) print(dy12_dx1,dy12_dx2)

在这里插入图片描述

三、利用自动微分和优化器求最小值

神经网络优化器&＃xff0c;主要是为了优化我们的神经网络&＃xff0c;使他在我们的训练过程中快起来&＃xff0c;节省社交网络训练的时间。在pytorch中提供了torch.optim方法优化我们的神经网络&＃xff0c;torch.optim是实现各种优化算法的包。

torch.optim.SGD

SGD是最基础的优化方法&＃xff0c;普通的训练方法, 需要重复不断的把整套数据放入神经网络NN中训练, 这样消耗的计算资源会很大.当我们使用SGD会把数据拆分后再分批不断放入 NN 中计算. 每次使用批数据, 虽然不能反映整体数据的情况, 不过却很大程度上加速了 NN 的训练过程, 而且也不会丢失太多准确率.

import numpy as np import torch # f(x) &＃61; a*x**2 &＃43; b*x &＃43; c的最小值x &＃61; torch.tensor(0.0,requires_grad &＃61; True) # x需要被求导 a &＃61; torch.tensor(1.0) b &＃61; torch.tensor(-2.0) c &＃61; torch.tensor(1.0)optimizer &＃61; torch.optim.SGD(params&＃61;[x],lr &＃61; 0.01)def f(x):result &＃61; a*torch.pow(x,2) &＃43; b*x &＃43; c return(result)for i in range(500):optimizer.zero_grad()y &＃61; f(x)y.backward()optimizer.step()print("y&＃61;",f(x).data,";","x&＃61;",x.data)

在这里插入图片描述

推荐阅读

python
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
python
学习python神器_Python学习／复习神器各种方法／技巧在哪用和典型例子（一）...

就我个人在学习Python的过程中，经常会出现学习了新方法后，如果隔上几天不用，就忘了的情况，或者刚学习的更好的方法没有得到 ... [详细]

蜡笔小新 2024-09-25 18:54:24
random
深度强化学习Policy Gradient基本实现

全文共2543个字，2张图，预计阅读时间15分钟。基于值的强化学习算法的基本思想是根据当前的状态，计算采取每个动作的价值，然 ... [详细]

蜡笔小新 2024-09-25 17:01:10
input
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
input
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
random
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
python
跪服！大四学生开发了一整套文言编程

机器之心报道参与：思、Jamin用文言文写的官方编程教程《文言陰符》，类似pip那样的包管理工具「文淵閣」，还有文言编程开源IDE「文言齋 ... [详细]

蜡笔小新 2024-09-27 20:11:29
input
【day3作业】:登陆时，从文件里面取账号和密码，判断用户是否存在，输入为空的也需要检验...

day3作业：　　2.登陆时，从文件里面取账号和密码，判断用户是否存在，输入为空的也需要检验importjsonall_us ... [详细]

蜡笔小新 2024-09-26 19:16:55
python
把数字拆分成2的幂的和

问题：任何数都能分解成2的幂，比如71+1+1+1+1+1+11+1+1+1+1+21+1+1+2+21+2+2+2 ... [详细]

蜡笔小新 2024-09-26 17:01:41
python
大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型：complex布尔型:bool2.字符串字符串：String3.与 ... [详细]

蜡笔小新 2024-09-26 12:44:43
python
DNNBrain：北师大团队出品，国内首款用于映射深层神经网络到大脑的统一工具箱...

导读深度神经网络(DNN)通过端到端的深度学习策略在许多具有挑战性的任务上达到了人类水平的性能。深度学习产生了具有多层抽象层次的数据表示;然而，它没有明确地提供任何关 ... [详细]

蜡笔小新 2024-09-26 12:34:26
case
python绘图设置正交坐标等距_Python:线性代数机器学习背后的优化原理 (五十五)...

线性代数：机器学习背后的优化原理线性代数作为数学的一个分支，广泛应用于科学和工程中，掌握好线性代数对于理解和从事机器学习算法相关工作是很有 ... [详细]

蜡笔小新 2024-09-26 10:09:12
python
Python 程序：打印偶数位置数组元素

编写一个Python程序，打印偶数位置或偶数索引位置的数组元素。在这个python示例中，我们使用了递增2的列表切片来打印偶数位置的数组元素。 ... [详细]

蜡笔小新 2024-09-26 08:12:52
version
【自动驾驶】second模型训练

1，数据组织：训练验证数据生成：pythoncreate_data.pynuscenes_data_prep--data_pathNU ... [详细]

蜡笔小新 2024-09-25 22:18:52
instance
mmcls多标签分类实战（二）：resnet多标签分类

上一章讲了如何制作数据集，接下来我们使用mmcls来实现多标签分类。 ... [详细]

蜡笔小新 2023-10-17 07:43:01

在海那边A-P

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章