开发笔记:专知PyTorch手把手深度学习教程05Dropout快速理解与PyTorch实现:图文+代码

作者：用户tznpaynnl5 | 来源：互联网 | 2023-07-18 18:03

篇首语：本文由编程笔记#小编为大家整理，主要介绍了专知-PyTorch手把手深度学习教程05Dropout快速理解与PyTorch实现:图文+代码相关的知识，希望对你有一定的参考价值。

篇首语：本文由编程笔记#小编为大家整理，主要介绍了专知-PyTorch手把手深度学习教程05Dropout快速理解与PyTorch实现: 图文+代码相关的知识，希望对你有一定的参考价值。

【导读】主题链路知识是我们专知的核心功能之一，为用户提供AI领域系统性的知识学习服务，一站式学习人工智能的知识，包含人工智能（机器学习、自然语言处理、计算机视觉等）、大数据、编程语言、系统架构。使用请访问专知进行主题搜索查看 - 桌面电脑访问www.zhuanzhi.ai, 手机端访问www.zhuanzhi.ai 或关注微信公众号后台回复" 专知"进入专知，搜索主题查看。值国庆佳节，专知特别推出独家特刊-来自中科院自动化所专知小组博士生huaiwen和Kun创作的-PyTorch教程学习系列, 今日带来第五篇-<快速理解系列(四): 图文+代码, 让你快速理解Dropout >

<快速理解系列(四): 图文+代码, 让你快速理解Dropout >

Dropout

学过神经网络的童鞋应该知道神经网络很容易过拟合。而且，如果要用集成学习的思想去训练非常多个神经网络，集成起来抵制过拟合，这样开销非常大并且也不一定有效。于是，这群大神提出了Dropout方法：在神经网络训练时，随机把一些神经单元去除，“瘦身”后的神经网络继续训练，最后的模型，是保留所有神经单元，但是神经的连接权重w乘上了一个刚才随机去除指数p.

左边是标准神经网络，右边是使用Dropout的神经网络，可见只是连接度少了一些，并不影响模型继续训练。其实，Dropout动机和初衷非常有意思。

文章里也谈到，可以类比人类男性和女性的基因。人类通过成千上万年进化，依然保持着这样的繁衍方式：男人贡献一半基因序列，女人贡献一半基因序列，最后组成后代的完整基因序列。当我们观察男人基因序列中的一个基因片段，它不仅要和男人基因序列很好地组合与配合，在繁衍后代时，也要和女人的那一半基因序列组合和配合，这个较好的一个基因片段一定要在两个情况下都很好的适应才行，这正像神经网络中的一个神经元，它要在各个情况下都很好地适应训练，所以，我们要Dropout一些神经元啊！

再来关注一个神经元：

【专知-PyTorch手把手深度学习教程05】Dropout快速理解与PyTorch实现: 图文+代码

需要指出的是，在训练时，权重参数w是共享的。就是说，只要连接权重的神经单元不dropout，那么每次调参时，权重接着调整参数值。换句话说，权重参数个数和不用Dropout的神经网络参数个数是一样的。不同的是，见上图，在训练时，每个神经单元都可能以概率p去除；在测试阶段，每个神经单元都是存在的，权重参数w要乘以p，成为：pw。

接下来看一下，每层Dropout网络和传统网络计算的不同之处：

【专知-PyTorch手把手深度学习教程05】Dropout快速理解与PyTorch实现: 图文+代码

最后就是一些实验结果和对比了，直接上代码

import torch from torch.autograd import Variable import matplotlib.pyplot as plt torch.manual_seed(1) lr = 0.1 N_SAMPLES = 20 N_HIDDEN = 300 # 训练数据 x = torch.unsqueeze(torch.linspace(-1, 1, N_SAMPLES), 1) y = x + 0.3*torch.normal(torch.zeros(N_SAMPLES, 1), torch.ones(N_SAMPLES, 1)) x, y = Variable(x), Variable(y) # 测试数据 test_x = torch.unsqueeze(torch.linspace(-1, 1, N_SAMPLES), 1) test_y = test_x + 0.3*torch.normal(torch.zeros(N_SAMPLES, 1), torch.ones(N_SAMPLES, 1)) test_x, test_y = Variable(test_x, volatile=True), Variable(test_y, volatile=True) # 展示一下数据分布 plt.scatter(x.data.numpy(), y.data.numpy(), c='magenta', s=50, alpha=0.5, label='train set') plt.scatter(test_x.data.numpy(), test_y.data.numpy(), c='cyan', s=50, alpha=0.5, label='test set') plt.legend(loc='upper left') plt.ylim((-2.5, 2.5)) plt.show() net_overfitting = torch.nn.Sequential( torch.nn.Linear(1, N_HIDDEN), torch.nn.ReLU(), torch.nn.Linear(N_HIDDEN, N_HIDDEN), torch.nn.ReLU(), torch.nn.Linear(N_HIDDEN, 1), ) net_dropped = torch.nn.Sequential( torch.nn.Linear(1, N_HIDDEN), torch.nn.Dropout(0.5), # drop out 0.5 torch.nn.ReLU(), torch.nn.Linear(N_HIDDEN, N_HIDDEN), torch.nn.Dropout(0.5), # drop out 0.5 torch.nn.ReLU(), torch.nn.Linear(N_HIDDEN, 1), ) print(net_overfitting) # 会过拟合的网络结构 """ Sequential ( (0): Linear (1 -> 300) (1): ReLU () (2): Linear (300 -> 300) (3): ReLU () (4): Linear (300 -> 1) ) """ print(net_dropped) # 使用了Dropout的网络结构 """ Sequential ( (0): Linear (1 -> 300) (1): Dropout (p = 0.5) (2): ReLU () (3): Linear (300 -> 300) (4): Dropout (p = 0.5) (5): ReLU () (6): Linear (300 -> 1) ) """ optimizer_ofit = torch.optim.Adam(net_overfitting.parameters(), lr=lr) optimizer_drop = torch.optim.Adam(net_dropped.parameters(), lr=lr) loss_func = torch.nn.MSELoss() plt.ion() # hold住图 for t in range(500): pred_ofit = net_overfitting(x) pred_drop = net_dropped(x) loss_ofit = loss_func(pred_ofit, y) loss_drop = loss_func(pred_drop, y) optimizer_ofit.zero_grad() optimizer_drop.zero_grad() loss_ofit.backward() loss_drop.backward() optimizer_ofit.step() optimizer_drop.step() if t % 10 == 0: # 切换到测试形态 net_overfitting.eval() net_dropped.eval() # 画一下 plt.cla() test_pred_ofit = net_overfitting(test_x) test_pred_drop = net_dropped(test_x) plt.scatter(x.data.numpy(), y.data.numpy(), c='magenta', s=50, alpha=0.3, label='train set') plt.scatter(test_x.data.numpy(), test_y.data.numpy(), c='cyan', s=50, alpha=0.3, label='test set') plt.plot(test_x.data.numpy(), test_pred_ofit.data.numpy(), 'r-', lw=3, label='no dropout') plt.plot(test_x.data.numpy(), test_pred_drop.data.numpy(), 'b--', lw=3, label='dropout(50%)') plt.text(0, -1.2, 'no dropout loss=%.4f' % loss_func(test_pred_ofit, test_y).data[0], fOntdict={'size': 20, 'color': 'red'}) plt.text(0, -1.5, 'dropout loss=%.4f' % loss_func(test_pred_drop, test_y).data[0], fOntdict={'size': 20, 'color': 'blue'}) plt.legend(loc='upper left'); plt.ylim((-2.5, 2.5));plt.pause(0.1) # 切换回训练形态 net_overfitting.train() net_dropped.train() plt.ioff() plt.show()

【专知-PyTorch手把手深度学习教程05】Dropout快速理解与PyTorch实现: 图文+代码

Reference:

神经网络抵制过拟合神器：Dropout 手把手论文入门 — 深度学习 DL 番外篇

http://nooverfit.com/wp/神经网络抵制过拟合神器：dropout-手把手论文入门

作者: david 9

明天继续推出：专知PyTorch深度学习教程系列-，敬请关注。

完整系列搜索查看，请PC登录

www.zhuanzhi.ai, 搜索“PyTorch”即可得。

对PyTorch教程感兴趣的同学，欢迎进入我们的专知PyTorch主题群一起交流、学习、讨论，扫一扫如下群二维码即可进入：

【专知-PyTorch手把手深度学习教程05】Dropout快速理解与PyTorch实现: 图文+代码

了解使用专知-获取更多AI知识！

-END-

欢迎使用专知

专知，一个新的认知方式！目前聚焦在人工智能领域为AI从业者提供专业可信的知识分发服务, 包括主题定制、主题链路、搜索发现等服务，帮你又好又快找到所需知识。

使用方法>>访问www.zhuanzhi.ai, 或点击文章下方“阅读原文”即可访问专知

中国科学院自动化研究所专知团队

@2017 专知

专 · 知

点击“
阅读原文
”，使用
专知！

推荐阅读

replace
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
timestamp
MySQL 5.7 学习指南：SQLyog 中的主键、列属性和数据类型

本文介绍了 MySQL 5.7 中主键（Primary Key）和自增（Auto-Increment）的概念，以及如何在 SQLyog 中设置这些属性。同时，还探讨了数据类型的分类和选择，以及列属性的设置方法。 ... [详细]

蜡笔小新 2024-11-12 15:57:04
io
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
io
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
io
Python应用实例大揭秘：七大令人惊叹的高阶技巧展示

2020年，Python无疑成为了最炙手可热的编程语言，其影响力已远远超出程序员的范畴。从初学者到资深从业者，甚至小学生，都在纷纷加入Python的学习热潮中。凭借其低门槛、易上手和强大的功能，Python正逐渐成为各行业不可或缺的工具。本文将揭示七个令人惊叹的Python高级应用技巧，帮助读者进一步提升编程水平。 ... [详细]

蜡笔小新 2024-11-11 15:04:48
grid
Python 序列图分割与可视化编程入门教程

本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例，详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表，帮助非编程背景的用户也能轻松上手。 ... [详细]

蜡笔小新 2024-11-11 07:14:26
replace
Vue 页面状态管理与跨页面数据传递的有效策略

在 Vue 应用开发中，页面状态管理和跨页面数据传递是常见需求。本文将详细介绍 Vue Router 提供的两种有效方式，帮助开发者高效地实现页面间的数据交互与状态同步，同时分享一些最佳实践和注意事项。 ... [详细]

蜡笔小新 2024-11-08 12:45:14
io
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
js
使用Python编写自动化脚本实现文件的全量与增量备份

本文探讨了利用Python编程语言开发自动化脚本来实现文件的全量和增量备份方法。通过详细分析不同备份策略的特点，文章介绍了如何使用Python标准库中的os和shutil模块来高效地管理和执行备份任务。此外，还提供了示例代码和最佳实践，帮助读者快速掌握自动化备份技术，确保数据的安全性和完整性。 ... [详细]

蜡笔小新 2024-11-05 09:50:57
future
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
io
AdMob 广告变现潜力几何：收益预测与分析

Google AdMob 为不同规模的应用开发者提供了一种高效且便捷的盈利途径，通过在应用中展示精准定向的广告来实现收入增长。本文将深入探讨 AdMob 的广告变现潜力，结合实际案例和数据，对收益进行预测与分析，帮助开发者更好地理解和利用这一工具。 ... [详细]

蜡笔小新 2024-11-04 11:01:49
io
开发者调查揭示：Python 备受青睐，PHP 成为最不受欢迎语言

Hired网站最新发布的开发者调查显示，Python 语言继续受到开发者的广泛欢迎，而 PHP 则被评为最不受欢迎的语言。该报告基于 Hired 数据科学团队对 13 个城市中 9800 名开发者的调查数据，深入分析了当前编程语言的使用趋势和开发者偏好。此外，报告还探讨了其他热门语言如 JavaScript 和 Java 的表现，并提供了对技术招聘市场的洞见。 ... [详细]

蜡笔小新 2024-11-03 14:37:24
rsa
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
rsa
深入探讨HMS Core多项功能的卓越优势与应用前景

华为推出的HMS Core不仅标志着其与全球开发者共同提升用户体验的决心，还展示了其在技术创新方面的强大实力。该平台涵盖了超过20项核心服务，构建了一个全面且高效的服务生态系统，旨在为全球用户提供更加优质、便捷的数字体验。 ... [详细]

蜡笔小新 2024-11-01 19:03:17
window
Python与R语言的功能对比及应用场景分析

Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性，但Python作为一种通用编程语言，适用于更广泛的领域，包括Web开发、自动化脚本和机器学习等。对于初学者而言，Python的学习曲线更为平缓，上手更加容易。此外，Python拥有庞大的社区支持和丰富的第三方库，使其在实际应用中更具灵活性和扩展性。 ... [详细]

蜡笔小新 2024-11-01 18:37:10

用户tznpaynnl5

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章