pytorch多GPU训练遇到的坑

作者：广东神秘地址 | 来源：互联网 | 2023-06-11 16:57

在打算由单GPU转成多GPU时，使用：self.modelself.model.cuda(devicedevice_ids[0])self.model

在打算由单GPU转成多GPU时&＃xff0c;使用&＃xff1a;

self.model &＃61; self.model.cuda(device&＃61;device_ids[0]) self.model &＃61; torch.nn.DataParallel(self.model,device_ids&＃61;device_ids)

设置后&＃xff0c;出现报错&＃xff0c;报错显示读取不到模型的参数&＃xff0c;原因是因为经过DataParallel包装过的模型如下&＃xff1a;
在这里插入图片描述
和使用单GPU时不同的是多了一个.module,所以再进行任何需要调用model里面参数的操作时&＃xff0c;都需要在model后面加上一个.module,即model.module&＃xff0c;这样才能提取出model里面的参数以及函数等。如图所示&＃xff1a;
在这里插入图片描述

pytorch
gpu

推荐阅读

pytorch
腾讯BERT推理模型TurboTransformers的快速推理能力

本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ... [详细]

蜡笔小新 2023-12-12 13:48:41
pytorch
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
pytorch
程序分析与优化9附录XLA的缓冲区指派

本章是系列文章的案例学习，不属于正篇，主要介绍了TensorFlow引入的XLA的优化算法。XLA也有很多局限性，XLA更多的是进行合并，但有时候如果参数特别多的场景下，也需要进行 ... [详细]

蜡笔小新 2023-10-16 16:17:29
人工智能
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
人工智能
GTX1070Ti显卡怎么样？GTX1070Ti显卡首发图赏+参数解读与拆解图

先来简单回顾一下今年的显卡市场，nvidia自从发布了帕斯卡架构新品之后，可以说是一直都主宰着高端游戏显卡市场，虽说amd也憋了一个hbm2的vega64出来，然而即使是最高贵的水 ... [详细]

蜡笔小新 2023-12-10 14:36:15
人工智能
红米3S3X|RROS-V7.0|安卓9.0|最强大的自定义|美观流畅|全新起航|魔幻动画|冰箱冻结|高级设置

该ROM为红米3S3X手机提供了最强大的自定义功能，包括美观流畅的界面、全新的起航动画、魔幻的动画效果以及冰箱冻结功能。同时，还提供了高级设置，包括悬浮窗口显示自定义、WIFI密码查看器、S8炫酷跑马灯显示自定义等多项实用功能。此外，该ROM还优化了手机的待机时间、wifi连接速度，并支持状态栏实时网速显示和电池电量百分比显示。 ... [详细]

蜡笔小新 2023-12-09 08:34:17
深度学习
Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本）安装教程

Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本）安装教程 ... [详细]

蜡笔小新 2023-10-17 21:10:23
深度学习
Android图形架构学习笔记（待修改）

以下简单总结来自Android官网，稍作总结：https:source.android.google.cndevicesgraphics概览Andr ... [详细]

蜡笔小新 2023-10-17 19:26:14
深度学习
Ubuntu 用户安装 Linux Kernel 3.15 RC1

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2023-10-17 18:29:07
深度学习
包含vb.net同时运行的词条

vb.net不用多线程如何同时运行两个过程？不用多线程？即使用多线程，也不会是“同时”执行，题主只要略懂一些计算机编译原理就能明白了。不用多线程更不可能让两个过程同步执行了。不过可 ... [详细]

蜡笔小新 2023-10-17 18:18:35
ocr
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
ocr
Caffe 生成 libcaffe error:未生成object对象

1.修改CommonSettings.props文件下compute_xx,sm_xx，其中 ... [详细]

蜡笔小新 2023-10-17 17:09:18
ocr
vb6集成ad登录共享文件_SCSP实验2单点登录

01—实验目的掌握单点登陆相关原理和深信服配置02—实验环境1.AC版本v12.0.42AC1地址：https:172.172.1.1AC2地址：htt ... [详细]

蜡笔小新 2023-10-17 15:23:51
pytorch
python batchnorm2d_BatchNorm2d原理、作用及其pytorch中BatchNorm2d函数的参数讲解

BN原理、作用：函数参数讲解：BatchNorm2d(256,eps1e-05,momentum0.1,affineTrue,track_running ... [详细]

蜡笔小新 2023-10-17 13:13:40
pytorch
OpenStack Q版本新功能以及各核心组件功能对比

OpenStackQ版本已经发布了一段时间了。今天,小编来总结一下OpenStackQ版本核心组件的各项主要新功能,再来汇总一下最近2年来OpenStackN、O、P、Q各版本核心 ... [详细]

蜡笔小新 2023-10-17 09:24:46

广东神秘地址

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章