pytorchrnn迁移到多个gpu上遇到的问题

作者：海风 | 来源：互联网 | 2023-09-25 13:45

今天在实验中需要把原本再单个gpu上运行的模型给迁移到多个gpu上的问题。于是使用了pytorch的dataparallel。结果其他网络模型都没有问题，只有text

今天在实验中需要把原本再单个gpu上运行的模型给迁移到多个gpu上的问题。于是使用了pytorch的data parallel。结果其他网络模型都没有问题&＃xff0c;只有text encoder出了问题。
原因有两个部分&＃xff1a;

hidden是用text encoder的自定义方法赋值的&＃xff0c;而且原来的hidden size为&＃xff08;a, batch size, b&＃xff09;&＃xff0c;但dataparallel分发任务默认将第一维当做batch size。于是对其进行了一番修改&＃xff0c;具体参考这篇博文
然后是另一个我没搜到解决方法的问题。我这边输出是有一个wordembs&＃xff0c;它的输出的第二维大小取决于当前数据最长的部分&＃xff0c;于是当返回的时候dataparallel对它做merge&＃xff0c;由于大小不一样报错了。&＃xff08;我尝试了传入这个batch里最大的长度&＃xff0c;不过后来由于其他地方出错&＃xff0c;我就把这块给删了。&＃xff09;

最后&＃xff0c;我发现还是将rnn给不用dataparallel要好用&＃xff0c;这样就不需要考虑各种各样的问题了。主要是我的rnn只是对文本编码&＃xff0c;只是我模型的一小部分&＃xff0c;所以解决起来还是可以的。

推荐阅读

jsp
C#之数据集：DataSet对象的使用及相关方法详解

本文介绍了C#中数据集DataSet对象的使用及相关方法详解，包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成，以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读，读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]

蜡笔小新 2023-12-14 12:09:13
jsp
PHP实现断点续传乱序合并文件的方法和源码

本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因，文件需要分割成多个部分发送，因此无法按顺序接收。文章中提供了merge2.php的源码，通过使用shuffle函数打乱文件读取顺序，实现了乱序合并文件的功能。同时，还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]

蜡笔小新 2023-12-14 04:33:19
jsp
腾讯BERT推理模型TurboTransformers的快速推理能力

本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ... [详细]

蜡笔小新 2023-12-12 13:48:41
jsp
花瓣|目标值_Compose 动画边学边做夏日彩虹

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Compose动画边学边做-夏日彩虹相关的知识，希望对你有一定的参考价值。引言Comp ... [详细]

蜡笔小新 2023-10-17 21:58:22
jsp
Android图形架构学习笔记（待修改）

以下简单总结来自Android官网，稍作总结：https:source.android.google.cndevicesgraphics概览Andr ... [详细]

蜡笔小新 2023-10-17 19:26:14
string
包含vb.net同时运行的词条

vb.net不用多线程如何同时运行两个过程？不用多线程？即使用多线程，也不会是“同时”执行，题主只要略懂一些计算机编译原理就能明白了。不用多线程更不可能让两个过程同步执行了。不过可 ... [详细]

蜡笔小新 2023-10-17 18:18:35
string
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
string
Add ConfigDocument API

Thisworkcameoutofthediscussioninhttps://github.com/typesafehub/config/issues/272 ... [详细]

蜡笔小新 2023-10-17 18:02:59
cmd
todolist增加markdown模块

markdown编辑器利用`markdown_js`开源库实现todolist小项目的markdown日记本功能todolist小项目地址之前的介绍随笔todoListmarkdown-js仓库遇到的 ... [详细]

蜡笔小新 2023-10-17 08:15:25
cmd
pytorch Dropout过拟合的操作

这篇文章主要介绍了pytorchDropout过拟合的操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完 ... [详细]

蜡笔小新 2023-10-16 19:35:56
cmd
程序分析与优化9附录XLA的缓冲区指派

本章是系列文章的案例学习，不属于正篇，主要介绍了TensorFlow引入的XLA的优化算法。XLA也有很多局限性，XLA更多的是进行合并，但有时候如果参数特别多的场景下，也需要进行 ... [详细]

蜡笔小新 2023-10-16 16:17:29
python
abaqus用python开发gui界面_AbaqusGUI程序开发指南Python语言

序言n前言nn第一章概述1n1．1简单插件实例——创建带孔板有限元模型2n1．2Abaqus图形界面程序开发的意义10nn第二章Python语言基础11 ... [详细]

蜡笔小新 2023-10-16 14:57:07
python
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
python
【OCR学习笔记】What Is Wrong With Scene Text Recognition Model Comparisons Dataset and Model Analysis

文章目录摘要细节开源代码摘要提出了一个统一的四阶段STR框架。Transformation：TPS，归一化字符区域到预定义的矩形，校正图像。Featureextraction ... [详细]

蜡笔小新 2023-10-15 18:16:55
java
让你基于jQuery的插件兼容commonjs,amd范例

事变是如许的，我写了一个基于jQuery的插件，在传统的开辟形式中，我们须要如今页面引入jQuery.js，然后在引入我们的插件，我们的插件才运用。然则跟着webpack的鼓起，我 ... [详细]

蜡笔小新 2023-10-16 18:13:51

海风

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章