热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Pytorch之深入理解torch.nn.Parameter()

先看一段代码:importtorchimporttorch.nnasnnatorch.tensor([1,2],dtypetorch.float32)prin

先看一段代码:

import torch
import torch.nn as nn
a=torch.tensor([1,2],dtype=torch.float32)
print(a)
print(nn.Parameter(a))
print(nn.parameter.Parameter(a))

在这里插入图片描述

结论:


  1. nn.Parameter=nn.parameter.Parameter
  2. parameter本质仍然是一个tensor。
  3. nn.Parameter的作用是:将一个不可训练的类型Tensor转换成可以训练的类型parameter,并且会向宿主模型注册该参数,成为一部分。即model.parameters()会包含这个parameter。从而,在参数优化的时候可以自动一起优化,这就不需要我们单独对这个参数进行优化啦。

其中2的证明如下:
在这里插入图片描述




补充


不少童鞋会想这个nn.Parameter(tensor)和对一个tensor直接进行`requires_grad=True`有什么区别?这两者不是一样的!
即下面的w1和w2功能是不一样的:

#对一个tensor直接进行`requires_grad=True`
w1=torch.tensor([1,2],dtype=torch.float32,requires_grad=True)#nn.Parameter(tensor)
a=torch.tensor([3,4],dtype=torch.float32)
w2=nn.Parameter(a)

功能哪里不一样?其实就是上面说的结论中的第3条,对一个tensor直接进行requires_grad=True确实也变成了可训练的tensor,但这个tensor无法像parameter那样自动包括在 model.parameters()中。

最后,我们做一个验证:

class mod(nn.Module):def __init__(self):super(mod,self).__init__()self.w1=torch.tensor([1,2],dtype=torch.float32,requires_grad=True)a=torch.tensor([3,4],dtype=torch.float32)self.w2=nn.Parameter(a)def forward(self,inputs):o1=torch.dot(self.w1,inputs)#使用了带梯度的普通tensoro2=torch.dot(self.w2,inputs)#使用了parameterreturn o1+o2

model=mod()
for p in model.parameters():print(p)

在这里插入图片描述
我们发现,只有parameter会在model.parameters()中,这意味这,w1参数需要手动单独优化。

补充:
上述好像只打印了参数,没有打印参数名称,有点low。高级的如下:

model.state_dict()
#或者
for para in model.named_parameters():print(para)







推荐阅读
author-avatar
Jasonscw
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有