当前位置: 开发笔记 > 编程语言 > 正文

pythonbatchnorm2d_BatchNorm2d原理、作用及其pytorch中BatchNorm2d函数的参数讲解

作者：手机用户2502869883 | 来源：互联网 | 2023-10-17 13:13

BN原理、作用：函数参数讲解：BatchNorm2d(256,eps1e-05,momentum0.1,affineTrue,track_running

BN原理、作用&＃xff1a;

函数参数讲解&＃xff1a;

BatchNorm2d(256, eps&＃61;1e-05, momentum&＃61;0.1, affine&＃61;True, track_running_stats&＃61;True)

1.num_features&＃xff1a;一般输入参数为batch_sizenum_featuresheight*width&＃xff0c;即为其中特征的数量&＃xff0c;即为输入BN层的通道数&＃xff1b;

2.eps&＃xff1a;分母中添加的一个值&＃xff0c;目的是为了计算的稳定性&＃xff0c;默认为&＃xff1a;1e-5,避免分母为0&＃xff1b;

3.momentum&＃xff1a;一个用于运行过程中均值和方差的一个估计参数(我的理解是一个稳定系数&＃xff0c;类似于SGD中的momentum的系数)&＃xff1b;

4.affine&＃xff1a;当设为true时&＃xff0c;会给定可以学习的系数矩阵gamma和beta

一般来说pytorch中的模型都是继承nn.Module类的&＃xff0c;都有一个属性trainning指定是否是训练状态&＃xff0c;训练状态与否将会影响到某些层的参数是否是固定的&＃xff0c;比如BN层或者Dropout层。通常用model.train()指定当前模型model为训练状态,model.eval()指定当前模型为测试状态。

同时&＃xff0c;BN的API中有几个参数需要比较关心的&＃xff0c;一个是affine指定是否需要仿射&＃xff0c;还有个是track_running_stats指定是否跟踪当前batch的统计特性。容易出现问题也正好是这三个参数&＃xff1a;trainning&＃xff0c;affine&＃xff0c;track_running_stats。

其中的affine指定是否需要仿射&＃xff0c;也就是是否需要上面算式的第四个&＃xff0c;如果affine&＃61;False则γ&＃61;1,β&＃61;0&＃xff0c;并且不能学习被更新。一般都会设置成affine&＃61;True。

trainning和track_running_stats&＃xff0c;track_running_stats&＃61;True表示跟踪整个训练过程中的batch的统计特性&＃xff0c;得到方差和均值&＃xff0c;而不只是仅仅依赖与当前输入的batch的统计特性。相反的&＃xff0c;如果track_running_stats&＃61;False那么就只是计算当前输入的batch的统计特性中的均值和方差了。当在推理阶段的时候&＃xff0c;如果track_running_stats&＃61;False&＃xff0c;此时如果batch_size比较小&＃xff0c;那么其统计特性就会和全局统计特性有着较大偏差&＃xff0c;可能导致糟糕的效果。

如果BatchNorm2d的参数track_running_stats设置False,那么加载预训练后每次模型测试测试集的结果时都不一样&＃xff1b;track_running_stats设置为True时&＃xff0c;每次得到的结果都一样。

running_mean和running_var参数是根据输入的batch的统计特性计算的&＃xff0c;严格来说不算是“学习”到的参数&＃xff0c;不过对于整个计算是很重要的。BN层中的running_mean和running_var的更新是在forward操作中进行的&＃xff0c;而不是在optimizer.step()中进行的&＃xff0c;因此如果处于训练中泰&＃xff0c;就算不进行手动step()&＃xff0c;BN的统计特性也会变化。

model.train() #处于训练状态

for data , label in self.dataloader:

pred &＃61;model(data) #在这里会更新model中的BN统计特性参数&＃xff0c;running_mean,running_var

loss&＃61;self.loss(pred,label)

#就算不进行下列三行&＃xff0c;BN的统计特性参数也会变化

opt.zero_grad()

loss.backward()

opt.step()

这个时候&＃xff0c;要用model.eval()转到测试阶段&＃xff0c;才能固定住running_mean和running_var&＃xff0c;有时候如果是先预训练模型然后加载模型&＃xff0c;重新跑测试数据的时候&＃xff0c;结果不同&＃xff0c;有一点性能上的损失&＃xff0c;这个时候基本上是training和track_running_stats设置的不对。

如果使用两个模型进行联合训练&＃xff0c;为了收敛更容易控制&＃xff0c;先预训练好模型model_A&＃xff0c;并且model_A内还有若干BN层&＃xff0c;后续需要将model_A作为一个inference推理模型和model_B联合训练&＃xff0c;此时希望model_A中的BN的统计特性量running_mean和running_var不会乱变化&＃xff0c;因此就需要将model_A.eval()设置到测试模型&＃xff0c;否则在trainning模式下&＃xff0c;就算是不去更新模型的参数&＃xff0c;其BN都会变化&＃xff0c;这将导致和预期不同的结果。

推荐阅读

import
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
import
图神经网络模型综述

本文综述了图神经网络（Graph Neural Networks, GNN）的发展，从传统的数据存储模型转向图和动态模型，探讨了模型中的显性和隐性结构，并详细介绍了GNN的关键组件及其应用。 ... [详细]

蜡笔小新 2024-11-28 13:27:43
js
中央电视台电影频道节目预告及优化分析

本文详细介绍了中央电视台电影频道的节目预告，并通过专业工具分析了其加载方式，确保用户能够获取最准确的电视节目信息。 ... [详细]

蜡笔小新 2024-12-25 21:01:14
import
如何在Python中调用C++代码

本文介绍了一种方法，通过使用Python的ctypes库来调用C++代码。具体实例为实现一个简单的加法器，并详细说明了从编写C++代码到编译及最终在Python中调用的全过程。 ... [详细]

蜡笔小新 2024-11-20 16:35:59
import
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
eval
Mathematica 12.3.1 中英文版正式发布，附新功能介绍

历经三十年的开发，Mathematica 已成为技术计算领域的标杆，为全球的技术创新者、教育工作者、学生及其他用户提供了一个领先的计算平台。最新版本 Mathematica 12.3.1 增加了多项核心语言、数学计算、可视化和图形处理的新功能。 ... [详细]

蜡笔小新 2024-12-22 09:34:59
eval
Python中eval()函数的使用技巧与注意事项

在Python编程中，eval()函数是一个强大的工具，用于执行字符串形式的Python表达式并返回其计算结果。本文将深入探讨eval()函数的基本用法及其潜在的安全风险，帮助读者在实际应用中更加谨慎和高效地使用这一功能。 ... [详细]

蜡笔小新 2024-12-16 11:03:07
post
Android中解析XML文件的实践指南

本文详细介绍了在Android应用开发中解析XML文件的方法，包括从本地文件和网络资源获取XML文件的不同途径，以及使用DOM、SAX和PULL三种解析方式的具体实现。 ... [详细]

蜡笔小新 2024-12-15 22:53:22
import
Python与PyTorch中图像数据的互转换方法

本文详细介绍了如何在Python和PyTorch环境中实现Tensor与NumPy数组之间的转换，以及PIL图像对象与NumPy数组之间的相互转换。内容包括具体的转换函数及其使用示例。 ... [详细]

蜡笔小新 2024-12-05 11:16:09
import
Python中实现长数据完全显示的方法

本文探讨了如何在Python中处理长数据的完全显示问题，包括numpy数组、pandas DataFrame以及tensor类型的完整输出设置。 ... [详细]

蜡笔小新 2024-12-02 11:17:26
python
如何更换Anaconda和pip的国内镜像源

本文详细介绍了如何通过国内多个知名镜像站（如北京外国语大学、中国科学技术大学、阿里巴巴等）更换Anaconda和pip的源，以提高软件包的下载速度和安装效率。 ... [详细]

蜡笔小新 2024-11-26 10:06:26
python
Python 开发环境最佳实践：Anaconda + Jupyter Notebook 快速上手指南

对于初学者而言，搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]

蜡笔小新 2024-11-21 18:30:23
search
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
import
Google Colab 免费 GPU 使用指南（第一部分）

本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境，支持多种深度学习框架，并且提供免费的 GPU 计算资源。 ... [详细]

蜡笔小新 2024-11-14 13:42:03
python
Python 中变量类型的确定与默认类型解析

本文详细探讨了 Python 中变量类型的确定方式及其默认类型，帮助初学者更好地理解变量类型的概念。 ... [详细]

蜡笔小新 2024-11-13 10:06:03

手机用户2502869883

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章