作者:kk1049057 | 来源:互联网 | 2023-09-10 17:47
1.Dropout可以比较有效的缓解过拟合的发生,在一定程度上达到正则化的效果。2.Dropout说的简单一点就是:我们在前向传播的时候,让某个神经元的激活值以一定的概率p停止工
1. Dropout可以比较有效的缓解过拟合的发生,在一定程度上达到正则化的效果。
2. Dropout说的简单一点就是:我们在前向传播的时候,让某个神经元的激活值以一定的概率p停止工作,这样可以使模型泛化性更强,因为它不会太依赖某些局部的特征,如图1所示。
![在这里插入图片描述](https://img.php1.cn/3cd4a/94ce/a6e/865776f6fe3d5f59.jpeg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQzMzk1NzE5,size_16,color_FFFFFF,t_70#pic_center)
3. 工作原理
![在这里插入图片描述](https://img.php1.cn/3cd4a/1eebe/cd5/a1be7872e8d4934f.webp?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQzMzk1NzE5,size_16,color_FFFFFF,t_70#pic_center)
![在这里插入图片描述](https://img.php1.cn/3cd4a/1eebe/cd5/8ad8f3bf8da691df.webp?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQzMzk1NzE5,size_16,color_FFFFFF,t_70#pic_center)
上面公式中Bernoulli函数是为了生成概率r向量,也就是随机生成一个0、1的向量。
4. 普通的dropout 通常适用于 全连接层网络, CNN网络一般不适用Dropout
5.Dropout在CNN中的应用 – DropBlock
![在这里插入图片描述](https://img.php1.cn/3cd4a/1eebe/cd5/1113165c4904ecc5.webp?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQzMzk1NzE5,size_16,color_FFFFFF,t_70#pic_center)
DropBlock 模块主要有2个参数,block_size,γ。
block_size:表示dropout的方块的大小(长,宽),当block_size=1,DropBlock 退化为传统的dropout,正常可以取3,5,7
6. Dropout2d
按通道随机丢弃