PyTorch常见预训练模型的下载链接及使用指南

作者：UUUUUUUUUU8 | 来源：互联网 | 2024-10-27 13:57

本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南，涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优，适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式，还详细说明了如何在实际项目中高效地加载和使用这些模型，为开发者提供全面的技术支持。

pytorch框架&＃xff1a;常用模型的预训练参数

六大分类模型下载方式和使用方法&＃xff1a;
Resnet
inception
Densenet
Alexnet
vggnet

Resnet: model_urls &＃061; { &＃039;resnet18&＃039;: &＃039;https://download.pytorch.org/models/resnet18-5c106cde.pth&＃039;, &＃039;resnet34&＃039;: &＃039;https://download.pytorch.org/models/resnet34-333f7ec4.pth&＃039;, &＃039;resnet50&＃039;: &＃039;https://download.pytorch.org/models/resnet50-19c8e357.pth&＃039;, &＃039;resnet101&＃039;: &＃039;https://download.pytorch.org/models/resnet101-5d3b4d8f.pth&＃039;, &＃039;resnet152&＃039;: &＃039;https://download.pytorch.org/models/resnet152-b121ed2d.pth&＃039;, } inception: model_urls &＃061; { # Inception v3 ported from TensorFlow &＃039;inception_v3_google&＃039;: &＃039;https://download.pytorch.org/models/inception_v3_google-1a9a5a14.pth&＃039;, } Densenet: model_urls &＃061; { &＃039;densenet121&＃039;: &＃039;https://download.pytorch.org/models/densenet121-a639ec97.pth&＃039;, &＃039;densenet169&＃039;: &＃039;https://download.pytorch.org/models/densenet169-b2777c0a.pth&＃039;, &＃039;densenet201&＃039;: &＃039;https://download.pytorch.org/models/densenet201-c1103571.pth&＃039;, &＃039;densenet161&＃039;: &＃039;https://download.pytorch.org/models/densenet161-8d451a50.pth&＃039;, } Alexnet: model_urls &＃061; { &＃039;alexnet&＃039;: &＃039;https://download.pytorch.org/models/alexnet-owt-4df8aa71.pth&＃039;, } vggnet: model_urls &＃061; { &＃039;vgg11&＃039;: &＃039;https://download.pytorch.org/models/vgg11-bbd30ac9.pth&＃039;, &＃039;vgg13&＃039;: &＃039;https://download.pytorch.org/models/vgg13-c768596a.pth&＃039;, &＃039;vgg16&＃039;: &＃039;https://download.pytorch.org/models/vgg16-397923af.pth&＃039;, &＃039;vgg19&＃039;: &＃039;https://download.pytorch.org/models/vgg19-dcbb9e9d.pth&＃039;, &＃039;vgg11_bn&＃039;: &＃039;https://download.pytorch.org/models/vgg11_bn-6002323d.pth&＃039;, &＃039;vgg13_bn&＃039;: &＃039;https://download.pytorch.org/models/vgg13_bn-abd245e5.pth&＃039;, &＃039;vgg16_bn&＃039;: &＃039;https://download.pytorch.org/models/vgg16_bn-6c64b313.pth&＃039;, &＃039;vgg19_bn&＃039;: &＃039;https://download.pytorch.org/models/vgg19_bn-c79401a0.pth&＃039;, }
学习内容&＃xff1a;测试实现预训练模型的使用&＃xff0c;并牢记该方式-拿为己用

关键步骤讲述&＃xff1a;

默认已经安装好环境和pytorch框架&＃xff0c;以及torchvision等需要的库。

import torchvision.models as models 所有成熟网络模型几乎都在里面

# 初始化模型 model &＃061; models.resnet18()此处应用ResNet18来分类。

修改尾巴&＃xff0c;毕竟你的输出不一定和原版&＃xff08;1000&＃xff09;一模一样。
# 修改网络结构&＃xff0c;将fc层1000个输出改为9个输出。
# 获取最后一层的输入特征层信息。 fc_input_feature &＃061; model.fc.in_features
# 取代原来输出层为新的nn。 model.fc &＃061; nn.Linear(fc_input_feature, 9)到这里&＃xff0c;网络就构建好了。

下载预训练参数&＃xff0c;为己所用。# load除最后一层的预训练权重 pretrained_weight &＃061; torch.hub.load_state_dict_from_url( url&＃061;&＃039;https://download.pytorch.org/models/resnet18-5c106cde.pth&＃039;, progress&＃061;True)到这里&＃xff0c;下载的是原版的1000分类的参数&＃xff0c;我们需要删除不需要的尾巴&＃xff0c;并训练自己的尾巴。del pretrained_weight[&＃039;fc.weight&＃039;]
del pretrained_weight[&＃039;fc.bias&＃039;]因为分类就是用的线性函数&＃xff0c;包括权重w和偏移b,只需删除尾巴。

最后&＃xff0c;将剩下的模型参数load到我们的模型上即可。model.load_state_dict(pretrained_weight, strict&＃061;False)模型准备完毕&＃xff0c;剩下的操作和所有训练方法一样。参见详细训练代码。

import os import torch from torch.utils.data import DataLoader from torch import nn from torch import optim import torchvision.models as models import time # use res18 # from resnet.resnetmini import ClassificModel as Model from datasets.read_data_sleep import PlayPhoneData def train(data_path&＃061;r"E:\Datasets\sleep_traindata"): # 设置超参数 batch_size &＃061; 1 # 每次训练的数据量 LR &＃061; 0.01 # 学习率 STEP_SIZE &＃061; 5 # 控制学习率变化 MAX_EPOCH &＃061; 20 # 总的训练次数 num_print &＃061; 100 # 每n个batch打印一次 playPhoneData &＃061; PlayPhoneData(data_path) # 利用dataloader加载数据集 train_loader &＃061; torch.utils.data.DataLoader(playPhoneData, batch_size&＃061;batch_size, shuffle&＃061;True, drop_last&＃061;True) # 生成驱动器 use_gpu &＃061; torch.cuda.is_available() if use_gpu: print(&＃039;congratulation! You can use gpu to support acceleration&＃039;) else: print(&＃039;oppps, please use a small batch size&＃039;) device &＃061; torch.device("cuda:0" if torch.cuda.is_available() else "cpu") # 初始化模型 model &＃061; models.resnet18() # 修改网络结构&＃xff0c;将fc层1000个输出改为9个输出 fc_input_feature &＃061; model.fc.in_features model.fc &＃061; nn.Linear(fc_input_feature, 9) # load除最后一层的预训练权重 pretrained_weight &＃061; torch.hub.load_state_dict_from_url( url&＃061;&＃039;https://download.pytorch.org/models/resnet18-5c106cde.pth&＃039;, progress&＃061;True) del pretrained_weight[&＃039;fc.weight&＃039;] del pretrained_weight[&＃039;fc.bias&＃039;] model.load_state_dict(pretrained_weight, strict&＃061;False) model.to(device) # net &＃061; Model(8).to(device) # class_num&＃061;8分八类&＃xff1a;睡岗(趴着睡&＃xff0c;躺着睡&＃xff0c;仰着睡&＃xff0c;低头睡)&＃xff0c;玩手机&＃xff08;俯视玩手机&＃xff0c;平视玩手机&＃xff0c;侧视玩手机&＃xff09;&＃xff0c;其他&＃061;[0&＃xff0c;1&＃xff0c;2&＃xff0c;3&＃xff0c;4&＃xff0c;5&＃xff0c;6&＃xff0c;7] # net &＃061; Model(9).to(device) # class_num&＃061;9分九类&＃xff1a;睡岗(趴着睡&＃xff0c;躺着睡&＃xff0c;低头睡)&＃xff0c;站立&＃xff0c;半蹲&＃xff0c;坐&＃xff08;背坐&＃xff0c;正坐&＃xff0c;侧坐&＃xff09;&＃xff0c;其他&＃061;[0&＃xff0c;1&＃xff0c;2&＃xff0c;3&＃xff0c;4&＃xff0c;5&＃xff0c;6&＃xff0c;7&＃xff0c;8] # 损失函数 get_loss &＃061; nn.CrossEntropyLoss() #交叉熵损失函数 # SGD优化器第一个参数是输入需要优化的参数,第二个是学习率&＃xff0c;第三个是动量&＃xff0c;大致就是借助上一次导数结果&＃xff0c;加快收敛速度。 &＃039;&＃039;&＃039; 这一行代码里面实际上包含了多种优化: 一个是动量优化,增加了一个关于上一次迭代得到的系数的偏置&＃xff0c;借助上一次的指导&＃xff0c;减小梯度震荡&＃xff0c;加快收敛速度一个是权重衰减&＃xff0c;通过对权重增加一个(正则项),该正则项会使得迭代公式中的权重按照比例缩减&＃xff0c;这么做的原因是&＃xff0c;过拟合的表现一般为参数浮动大&＃xff0c;使用小参数可以防止过拟合 &＃039;&＃039;&＃039; optimizer &＃061; optim.SGD(model.parameters(), lr&＃061;LR, momentum&＃061;0.9, weight_decay&＃061;0.001) # optimizer &＃061; optim.Adam(net.parameters(), lr&＃061;learn_rate) # 动态调整学习率 StepLR 是等间隔调整学习率&＃xff0c;每step_size 令lr&＃061;lr*gamma # 学习率衰减&＃xff0c;随着训练的加深&＃xff0c;目前的权重也越来越接近最优权重&＃xff0c;原本的学习率会使得&＃xff0c;loss上下震荡&＃xff0c;逐步减小学习率能加快收敛速度。 # scheduler &＃061; optim.lr_scheduler.StepLR(optimizer, step_size&＃061;STEP_SIZE, gamma&＃061;0.5, last_epoch&＃061;-1) # Step:设置学习率下降策略 scheduler &＃061; torch.optim.lr_scheduler.StepLR(optimizer, step_size&＃061;10, gamma&＃061;0.1) loss_list &＃061; [] start &＃061; time.time() for epoch in range(MAX_EPOCH): running_loss &＃061; 0.0 # enumerate()是python自带的函数&＃xff0c;用于迭代字典。参数1&＃xff0c;是需要迭代的对象&＃xff0c;第二参数是迭代的起始位置 for i, (inputs, labels) in enumerate(train_loader, 0): inputs, labels &＃061; inputs.to(device), labels.to(device) outputs &＃061; model(inputs) # 前向传播求出预测的值 optimizer.zero_grad() # 将梯度初始化为0 loss &＃061; get_loss(outputs, labels.long()) loss.backward() # 反向传播求梯度 optimizer.step() # 更新所有参数 running_loss &＃043;&＃061; loss.item() # loss是张量&＃xff0c;访问值时需要使用item() loss_list.append(loss.item()) if i % num_print &＃061;&＃061; num_print - 1: # 每num_print打印平均loss print(&＃039;[%d epoch, %d] loss: %.6f&＃039; % (epoch &＃043; 1, i &＃043; 1, running_loss / num_print)) running_loss &＃061; 0.0 lr &＃061; optimizer.param_groups[0][&＃039;lr&＃039;] # 查看目前的学习率 print(&＃039;learn_rate : %.5f&＃039; % lr) scheduler.step() # 根据迭代epoch更新学习率 end &＃061; time.time() print(&＃039;time:{}&＃039;.format(end - start)) torch.save(model, f&＃039;E:/model/playphone&＃043;sleepthepose/model_resnetmini_睡岗9分类{end}.pth&＃039;) if __name__ &＃061;&＃061; "__main__": train()

训练情况&＃xff1a;

...... [3 epoch, 500] loss: 2.186424 [3 epoch, 600] loss: 2.192622 [3 epoch, 700] loss: 2.165229 [3 epoch, 800] loss: 2.125184 [3 epoch, 900] loss: 2.185377 learn_rate : 0.01000 [4 epoch, 100] loss: 2.138786 [4 epoch, 200] loss: 2.177925 [4 epoch, 300] loss: 2.103718 ......

备注&＃xff1a;代码只是讲解工具&＃xff0c;并非可以运行的实例&＃xff0c;因为里面的数据集需要有并自己写数据集的代码。

学习内容&＃xff1a;进阶应用方法

直接拿来用固然不错&＃xff0c;但自己分装一遍再用&＃xff0c;显得更加标准&＃xff0c;有水平。
比如封装如下:

class ResNet18forClassify(nn.Module): def __init__(self, phase&＃061;"train"): super(ResNet18forClassify, self).__init__() self.phase &＃061; phase self.net &＃061; models.resnet18() fc_input_feature &＃061; self.net.fc.in_features self.net.fc &＃061; nn.Linear(fc_input_feature, 9) pretrained_weight &＃061; torch.hub.load_state_dict_from_url( url&＃061;&＃039;https://download.pytorch.org/models/resnet18-5c106cde.pth&＃039;, progress&＃061;True) del pretrained_weight[&＃039;fc.weight&＃039;] del pretrained_weight[&＃039;fc.bias&＃039;] self.net.load_state_dict(pretrained_weight, strict&＃061;False) self.softmax &＃061; nn.Softmax(dim&＃061;1) def forward(self, input_img): out &＃061; self.net(input_img) if self.phase &＃061;&＃061; "test": return self.softmax(out) return out

备注&＃xff1a;封装成自己的网络模型&＃xff0c;更加方便。
其中,if self.phase &＃061;&＃061; "test": return self.softmax(out)&＃xff0c;分类时训练输出的是类别标签与实际标签做损失计算&＃xff1b;测试时&＃xff0c;预测结果由激活函数转换为–类型和该类型可能性概率。输出可能是该类别的概率值。

参考文献&＃xff1a;

1.https://github.com/pytorch/vision/tree/master/torchvision/models
2.环境搭建&＃xff1a;NVIDIA&＃043;CUDA&＃043;cudaNN的配置与Anaconda虚拟环境的搭建–深度学习第一步
3.Parallax:常用预训练模型下载地址

来源：柏常青

推荐阅读

install
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
text
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
io
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
default
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
text
使用Objective-C和dispatch库实现并发素数计算

本文介绍如何使用Objective-C结合dispatch库进行并发编程，以提高素数计数任务的效率。通过对比纯C代码与引入并发机制后的代码，展示dispatch库的强大功能。 ... [详细]

蜡笔小新 2024-12-28 08:44:35
text
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
io
Java 类成员初始化顺序与数组创建

本文探讨了Java中类成员的初始化顺序、静态引入、可变参数以及finalize方法的应用。通过具体的代码示例，详细解释了这些概念及其在实际编程中的使用。 ... [详细]

蜡笔小新 2024-12-27 19:39:42
text
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
io
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
text
java编写的简易计算器

主要用了2个类来实现的，话不多说，直接看运行结果，然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]

蜡笔小新 2024-12-27 18:18:10
io
Java 中 Writer flush()方法，示例

Java 中 Writer flush()方法，示例 ... [详细]

蜡笔小新 2024-12-28 06:41:52
go
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31
install
解决 Python 项目中 setuptools_rust 模块缺失问题

本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误，并提供了解决方案。 ... [详细]

蜡笔小新 2024-12-27 18:06:18
install
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
io
精选Python视频教程：来自国际顶尖讲师的全面指南（附中文字幕）

本文将介绍由密歇根大学Charles Severance教授主讲的顶级Python入门系列课程，该课程广受好评，被誉为Python学习的最佳选择。通过生动有趣的教学方式，帮助初学者轻松掌握编程基础。 ... [详细]

蜡笔小新 2024-12-27 15:14:33

UUUUUUUUUU8

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章