热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

torch笔记十二|读取和保存

文章目录一、方法二、读写tensor三、读写模型四、实例1.理解2.实例一、方法通过save函数和load函数可以很方便地读写Tensor。通过save函数和load_stat

文章目录

    • 一、方法
    • 二、读写tensor
    • 三、读写模型
    • 四、实例
      • 1.理解
      • 2.实例


一、方法

·通过save函数和load函数可以很方便地读写Tensor。

·通过save函数和load_state_dict函数可以很方便地读写模型的参数。

二、读写tensor

import torch
import torch.nn as nn# 1.创建x,并将其存入文件名为x.pt的文件里
x = torch.ones(5)
torch.save(x, 'x.pt')# 2.将数据从存储的文件读回内存
y = torch.load('x.pt')
print(y)# 3.保存提取列表
x1 = torch.ones(3)
x2 = torch.ones(2)
x_list = [x1, x2]
torch.save(x_list, 'x_list.pt')
y_list = torch.load('x_list.pt')
print(y_list)# 4.存储并读取一个从字符串映射到Tensor的字典
torch.save({'x1': x1, 'x2': x2}, 'x_dict.pt')
y_dict = torch.load('x_dict.pt')
print(y_dict)

三、读写模型

# 1.只保存和加载模型参数
torch.save(model.state_dict(), PATH) # 推荐的文件后缀名是pt或pth
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))# 2.保存和加载整个模型
torch.save(model, PATH)
model = torch.load(PATH)# 3. 例子1:
net = torch.nn.Sequential(torch.nn.Linear(3, 1))
X = torch.randn(2, 3)
Y = net(X)
# 保存模型参数
PATH = "./net.pt"
torch.save(net.state_dict(), PATH)
# 加载模型参数
net2 = torch.nn.Sequential(torch.nn.Linear(3, 1)) # 需要先搭建网络结构
net2.load_state_dict(torch.load(PATH))
Y2 = net2(X)
print(Y2 == Y) # True# 4.例子2:
net = torch.nn.Sequential(torch.nn.Linear(3, 1))
X = torch.randn(2, 3)
Y = net(X)PATH = "./net1.pt"
torch.save(net, PATH)net2 = torch.load(PATH) # 不需要重新搭建网络
Y2 = net2(X)
print(Y2 == Y) # True

四、实例


1.理解

保存:

保存训练好的整个网络:torch.save(net1,'net1.pth')
只保存网络的参数:torch.save(net1.state_dict(),'net1_params.pth')

提取:

调用整个训练好的网络:net2 = torch.load('net1.pth')
只调用网络的参数:net3.load_state_dict(torch.load('net1_params.pth'))

其中,net1是训练好的网络的名称,’ '内部是保存的文件名称(后缀是.pth或者.pkl)

注意:
(1)只保存网络中的参数速度快, 占内存少,推荐使用。但是调用网络的参数时,新网络需要自己定义网络,再使用上面的调用指令。其中的参数名称与结构要与保存模型中的一致,可以是部分网络比如只使用VGG的前几层,相对灵活,便于对网络进行修改。
(2)调用整个网络则无需自定义网络可以直接调用。保存时已把网络结构保存,比较死板,不能调整网络结构。

2.实例

2.1 实验结果

以我的[pytorch学习笔记二]数据的拟合为例,将训练好的net1网络保存好,net2调用的整个网络,net3只调用了net1的参数,最终拟合的效果一模一样。
在这里插入图片描述
2.2完整代码

# 1.导入必要的模块
import torch
import torch.nn.functional as F # F中包含很多函数比如激励函数
import matplotlib.pyplot as plt #用于绘图# 2.生成要拟合的数据点
x = torch.unsqueeze(torch.linspace(-1,1,100),dim=1)
y = x.pow(2) + 0.2 * torch.rand(x.size())# 3.搭建、训练、保存网络net1
def save():net1 = torch.nn.Sequential(torch.nn.Linear(1, 8),torch.nn.ReLU(),torch.nn.Linear(8, 1))optimizer = torch.optim.SGD(net1.parameters(), lr=0.5)loss_func = torch.nn.MSELoss()for t in range(100):prediction = net1(x)loss = loss_func(prediction, y)optimizer.zero_grad()loss.backward()optimizer.step()# 保存训练好的整个网络torch.save(net1, 'net1.pth')# 只保存训练好的网络的参数torch.save(net1.state_dict(), 'net1_params.pth')# 绘图,可视化net1的训练结果plt.figure(1,figsize=(10,3))plt.subplot(131)plt.title('net1')plt.scatter(x.data.numpy(), y.data.numpy()) # 打印原始数据散点图plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5)# 调用整个网络(包括计算图、参数等等)
def restore_net():net2 = torch.load('net1.pth')# 调用网络时,要设置输入prediction = net2(x)plt.subplot(132)plt.title('net2')plt.scatter(x.data.numpy(), y.data.numpy())plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5)# 只调用网络的参数
def restore_params():# 只调用网络的参数时,需要提前搭建和net1网络相同的架构net3 = torch.nn.Sequential(torch.nn.Linear(1, 8),torch.nn.ReLU(),torch.nn.Linear(8, 1))net3.load_state_dict(torch.load('net1_params.pth'))prediction = net3(x)plt.subplot(133)plt.title('net3')plt.scatter(x.data.numpy(), y.data.numpy()) # 打印原始数据散点图plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5)plt.show()save()restore_net()restore_params()


推荐阅读
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 【图像分类实战】利用DenseNet在PyTorch中实现秃头识别
    本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先,文章概述了项目所需的库和全局参数设置。接着,对图像进行预处理并读取数据集。随后,构建并配置DenseNet模型,设置训练和验证流程。最后,通过测试阶段验证模型性能,并提供了完整的代码实现。本文不仅涵盖了技术细节,还提供了实用的操作指南,适合初学者和有经验的研究人员参考。 ... [详细]
  • 函子(Functor)是函数式编程中的一个重要概念,它不仅是一个特殊的容器,还提供了一种优雅的方式来处理值和函数。本文将详细介绍函子的基本概念及其在函数式编程中的应用,包括如何通过函子控制副作用、处理异常以及进行异步操作。 ... [详细]
  • 本文将深入探讨生成对抗网络(GAN)在计算机视觉领域的应用。作为该领域的经典模型,GAN通过生成器和判别器的对抗训练,能够高效地生成高质量的图像。本文不仅回顾了GAN的基本原理,还将介绍一些最新的进展和技术优化方法,帮助读者全面掌握这一重要工具。 ... [详细]
  • 深入解析Unity3D游戏开发中的音频播放技术
    在游戏开发中,音频播放是提升玩家沉浸感的关键因素之一。本文将探讨如何在Unity3D中高效地管理和播放不同类型的游戏音频,包括背景音乐和效果音效,并介绍实现这些功能的具体步骤。 ... [详细]
  • 服务器虚拟化存储设计,完美规划储存与资源,部署高性能虚拟化桌面
    规划部署虚拟桌面环境前,必须先估算目前所使用实体桌面环境的工作负载与IOPS性能,并慎选储存设备。唯有谨慎估算贴近实际的IOPS性能,才能 ... [详细]
  • Asynchronous JavaScript and XML (AJAX) 的流行很大程度上得益于 Google 在其产品如 Google Suggest 和 Google Maps 中的应用。本文将深入探讨 AJAX 在 .NET 环境下的工作原理及其实现方法。 ... [详细]
  • 使用Matlab创建动态GIF动画
    动态GIF图可以有效增强数据表达的直观性和吸引力。本文将详细介绍如何利用Matlab软件生成动态GIF图,涵盖基本代码实现与高级应用技巧。 ... [详细]
  • 本文探讨了Python类型注解使用率低下的原因,主要归结于历史背景和投资回报率(ROI)的考量。文章不仅分析了类型注解的实际效用,还回顾了Python类型注解的发展历程。 ... [详细]
  • 本文将详细探讨 Python 编程语言中 sys.argv 的使用方法及其重要性。通过实际案例,我们将了解如何在命令行环境中传递参数给 Python 脚本,并分析这些参数是如何被处理和使用的。 ... [详细]
  • 本文详细介绍了如何在Mac操作系统中为IntelliJ IDEA配置更高的内存限制,以提高开发效率和性能。 ... [详细]
  • 在尝试加载支持推送通知的iOS应用程序的Ad Hoc构建时,遇到了‘no valid aps-environment entitlement found for application’的错误提示。本文将探讨此错误的原因及多种可能的解决方案。 ... [详细]
  • 本文详细介绍了Oracle 11g中的创建表空间的方法,以及如何设置客户端和服务端的基本配置,包括用户管理、环境变量配置等。 ... [详细]
  • publicclassBindActionextendsActionSupport{privateStringproString;privateStringcitString; ... [详细]
  • 本文探讨了BERT模型在自然语言处理领域的应用与实践。详细介绍了Transformers库(曾用名pytorch-transformers和pytorch-pretrained-bert)的使用方法,涵盖了从模型加载到微调的各个环节。此外,还分析了BERT在文本分类、情感分析和命名实体识别等任务中的性能表现,并讨论了其在实际项目中的优势和局限性。 ... [详细]
author-avatar
edftgggh_131
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有