相关论文总结

作者：駱宏艷_230 | 来源：互联网 | 2023-06-18 22:31

目录1.PruningFiltersforEfficientConvNets2.LearningStructuredSparsityinDeepNeuralNetworks3.Le

目录1. Pruning Filters for Efficient ConvNets
2. Learning Structured Sparsity in Deep Neural Networks
3. Learning Efficient Convolutional Networks through Network Slimming
4. Channel Pruning for Accelerating Very Deep Neural Networks
5. HRank&＃xff1a;Filter Pruning using High-Rank Feature Map
6. Channel Pruning via Automatic Structure Search
7. DropNet: Reducing Neural Network Complexity via Iterative Pruning
8. DMCP: Differentiable Markov Channel Pruning for Neural Networks
9. Rethinking the Value of Network Pruning


1. Pruning Filters for Efficient ConvNets 
题目Pruning Filters for Efficient ConvNets
作者与单位ICLR2016 美国马里兰大学 Hao Li
方法和要解决的问题过滤器剪枝(基于feater map通道的剪枝&＃xff09;
基于幅度的权重修剪减少了来自完全连接层的大量参数&＃xff0c;并且由于修剪网络中的不规则稀疏性&＃xff0c;可能不能充分降低卷积层中的计算成本。
idea1.对每层的滤波器进行取范数并对比大小&＃xff0c;删除其排名靠后的滤波器。主要还考虑了对应特征映射上为0的位置&＃xff0c;一并删去。
2.提出了敏感度的概念。即剪枝某层过滤器时对准确度影响小&＃xff0c;就是敏感度小&＃xff0c;可以参看:图a
3.也重点介绍了对于resnet网络的修剪&＃xff0c;所要关注的点。
讨论这种结构化的剪枝方式&＃xff0c;不引入不规则的稀疏性。为了简化修剪&＃xff0c;使用了一次性的修剪在训练的策略。
结果1.VGG-16 34%加速
2.ResNet-110 38%加速
3.同时通过对网络进行再训练&＃xff0c;可以恢复到接近原始精度的水平.
备注代码开源&＃xff0c;已经阅读对vgg剪枝的代码

2. Learning Structured Sparsity in Deep Neural Networks 
题目Learning Structured Sparsity in Deep Neural Networks
作者与单位NIPS2016 匹兹堡大学 Wei Wen
方法和要解决的问题神经网络学习参数冗余&＃xff0c;学习更加稀疏的权值。
1.训练更加紧凑的模型&＃xff0c;节省计算开销。
2.硬件友好的结构化稀疏&＃xff0c;易于加速。
3.提供了正则化&＃xff0c;有更好的泛化能力&＃xff0c;提升精度。
idea1. 借鉴lasso group提出了一种正则化损失函数用于对卷积层&＃xff0c;通道&＃xff0c;过滤器趋于0。
讨论仅仅是一种L1正则化方法&＃xff0c;让更多的权值为0&＃xff0c;在移除实现模型的压缩。
结果这种方法可以在CPU/GPU上对AlexNet分别达到平均5.1和3,1倍的加速。在CIFAR10上训练ResNet&＃xff0c;从20层减少到18层&＃xff0c;并提高了精度
备注代码开源&＃xff0c;caffe代码
1.得到的结构化稀疏矩阵用于加速&＃xff0c;但是训练的引入的损失函数项目比较多&＃xff0c;这个方法需要额外计算新引入的和所有filters有关的梯度项&＃xff0c;这是一个问题。
2. 仅仅实验了LeNet and AlexNet.
3. 损失函数变化&＃xff0c;需要从头训练&＃xff0c;耗费时间。 

论文详细介绍 

3. Learning Efficient Convolutional Networks through Network Slimming 
题目Learning Efficient Convolutional Networks through Network Slimming
作者与单位ICCV2017 清华大学
方法和要解决的问题模型压缩要解决的问题
1.减小模型的大小
2.减小运行时内存的时间
3.不影响精度的同时&＃xff0c;提高计算的操作数。

目前存在的问题是&＃xff1a;上篇论文提出的SSL方法缺点看备注。
ideaL&＃61;∑(x,y)l(f(x,W),y)&＃43;λ∑γ∈Γg(γ)L&＃61;\sum_{(x, y)} l(f(x, W), y)&＃43;\lambda \sum_{\gamma \in \Gamma} g(\gamma)L&＃61;(x,y)∑​l(f(x,W),y)&＃43;λγ∈Γ∑​g(γ)1.我们的方法是将L1正则化施加到BN层的缩放因子上&＃xff0c;L1正则化推动BN层的缩放因子趋向于零&＃xff0c;这使得我们能够鉴别出不重要的通道或者神经元&＃xff0c;因为每一个缩放因子都和一个特定的CNN卷积通道&＃xff08;或者全连接层的一个神经元&＃xff09;相关联。
2.对跳跃连接也提出了方法
讨论这是结构化稀疏或者剪枝不需要特别的库来实现加速
结果该方法能够在不损失精度的情况下显著降低现有网络的计算代价(最高可达20倍)。更重要的是&＃xff0c;该方法同时减少了模型规模、运行时内存和计算运算量&＃xff0c;同时给训练过程带来了最小的开销&＃xff0c;并且所得到的模型不需要专门的库/硬件来进行有效的推理。
备注代码开源&＃xff0c;pytorch代码
代码好写&＃xff0c;但是仅仅训练过程变得简单(损失函数变得不多)&＃xff0c;但是在精度上没有特别大的进步 

论文详细介绍 

4. Channel Pruning for Accelerating Very Deep Neural Networks 
题目Channel Pruning for Accelerating Very Deep Neural Networks
作者与单位ICCV2017 旷视科技
方法和要解决的问题模型存在冗余
ideaarg⁡min⁡β,W12N∥Y−∑i&＃61;1cβiXiWi⊤∥F2subject to ∥β∥0≤c\begin{array}{l}\underset{\beta, W}{\arg \min } \frac{1}{2 N}\left\|Y-\sum_{i&＃61;1}^{c} \beta_{i} X_{i} W_{i}^{\top}\right\|_{F}^{2} \\\text {subject to }\|\beta\|_{0} \leq c\end{array}β,Wargmin​2N1​∥∥​Y−∑i&＃61;1c​βi​Xi​Wi⊤​∥∥​F2​subject to ∥β∥0​≤c​1. 提出了一种基于最小化特征重建误差的算法用于通道的裁制。
2. 作者对这种方法提出了两步迭代的优化算法
3. 对应用于多分支结构和和跳跃连接的也提出了额方法。
讨论该方法是逐层进行剪枝的&＃xff0c;比较复杂&＃xff0c;其中也有需要手工的感觉&＃xff0c;而且训练阶段繁琐。
结果修剪过的vgg16实现了5倍的加速和只有0.3%的误差增加比起最先进的结果。更重要的是&＃xff0c;该方法能够加快ResNet、Xception等现代网络的速度&＃xff0c;在2倍的速度提升下&＃xff0c;精度损失分别只有1.4%和1.0%&＃xff0c;
备注代码开源&＃xff0c;咖啡框架组会讲解

训练比较繁琐&＃xff0c;而且是两步迭代&＃xff0c;而且训练时间很长&＃xff0c;需要微调 

5. HRank&＃xff1a;Filter Pruning using High-Rank Feature Map 
题目HRank&＃xff1a;Filter Pruning using High-Rank Feature Map
作者与单位CVPR2020 厦门大学
方法和要解决的问题总结了以往的剪枝主要分为两类
1. 通过判断属性的重要性
2. 通过适应性的属性
它们的区别是&＃xff1a;第一种在训练之后进行剪枝&＃xff0c;虽然时间的复杂度降低&＃xff0c;但是也限制了加速比和压缩比。第二种方法需要将剪枝的要求嵌入到网络训练的损失&＃xff0c;但是需要重新训练&＃xff0c;比较花时间。
作者提出的了一种有效且高效的滤波器剪枝方法&＃xff0c;该方法探索每一层特征图的高矩阵秩(HRank)。它是一种基于属性的修剪方法&＃xff08;第一种&＃xff0c;不用重重新训练&＃xff0c;简化了剪枝的复杂性&＃xff09;。
ideamin⁡δij∑i&＃61;1K∑j&＃61;1niδij(wji)∑t&＃61;1gRank⁡(oji(t,:,:))\min _{\delta_{i j}} \sum_{i&＃61;1}^{K} \sum_{j&＃61;1}^{n_{i}} \delta_{i j}\left(\mathbf{w}_{j}^{i}\right) \sum_{t&＃61;1}^{g} \mathbf{R} \operatorname{ank}\left(\mathbf{o}_{j}^{i}(t,:,:)\right)minδij​​∑i&＃61;1K​∑j&＃61;1ni​​δij​(wji​)∑t&＃61;1g​Rank(oji​(t,:,:))
s.t.∑j&＃61;1niδij&＃61;ni2s . t . \sum_{j&＃61;1}^{n_{i}} \delta_{i j}&＃61;n_{i 2}s.t.∑j&＃61;1ni​​δij​&＃61;ni2​1. 在大量统计验证的基础上&＃xff0c;证明了单个滤波器生成的特征图的平均秩几乎没有变化。
2. 从数学上证明&＃xff0c;具有较低秩特征图的过滤器信息量较小&＃xff0c;因此对保持准确性不太重要&＃xff0c;可以首先删除这些准确性。
3. 广泛的实验证明了HRank模型压缩和加速在各种最新技术状态下的效率和效果
讨论我感觉这一种方法是训练之后进行操作&＃xff0c;可以进行实现&＃xff0c;可以参考
结果文章在小数据集和大数据集上进行了实验&＃xff0c;即CIFAR-10和ImageNet。研究了不同算法在主流CNN模型上的性能&＃xff0c;包括VGGNet、GoogLeNet、ResNet和DenseNet。
例如&＃xff1a;使用ResNet-110&＃xff0c;通过删除59.2%的参数&＃xff0c;我们实现了58.2%的FLOPS减少&＃xff0c;而CIFAR-10的TOP-1准确率仅有0.14%的微小损失。使用ResNet-50&＃xff0c;通过删除36.7%的参数&＃xff0c;我们实现了43.8%的Flops减少&＃xff0c;而ImageNet上的TOP1准确率仅损失了1.17%。
备注pytorch代码开源&＃xff0c;可以下一步实验。 

论文详细介绍

6. Channel Pruning via Automatic Structure Search 
题目Channel Pruning via Automatic Structure Search
作者与单位IJCAI_2020 厦门大学 Mingbao Lin
方法和要解决的问题现有的剪枝方法大多侧重于通过重要性/最优化或基于经验规则设计的正则化来选择通道(滤波器)&＃xff0c;这是次优剪枝的缺陷。
ideaRethinking the value of network pruning. In ICLR, 2019论文表明&＃xff0c;通道修剪的实质在于找到最优的修剪结构&＃xff0c;即每层的通道数&＃xff0c;而不是选择“重要”的通道。

为了解决深层网络中难以处理的巨大剪枝结构组合问题&＃xff0c;首先提出将保留通道限制在特定空间内的组合缩小&＃xff0c;从而大大减少剪枝结构的组合。然后&＃xff0c;将最优剪枝结构的搜索问题转化为优化问题&＃xff0c;并结合ABC算法进行自动求解&＃xff0c;以减少人为干扰。ABCPruner已经被证明是更有效的&＃xff0c;它还能够以端到端的方式高效地进行微调。
讨论这个方法不同于先前选择那些重要的通道&＃xff0c;而是选择通道数目为优化目标&＃xff0c;也是探究的方向
结果在CIFAR-10上进行的实验表明&＃xff0c;ABCPruner减少了73.68&＃xff05;的FLOP和88.68&＃xff05;的参数&＃xff0c;而VGGNet-16的准确度甚至提高了0.06&＃xff05;。在ILSVRC-2012上&＃xff0c;它减少了62.87&＃xff05;的FLOP&＃xff0c;并去除了60.01&＃xff05;的参数&＃xff0c;而ResNet-152的准确度损失却微不足道。
备注pytorch代码开源&＃xff0c;可以下一步实验。 

论文详细介绍

7. DropNet: Reducing Neural Network Complexity via Iterative Pruning 
题目DropNet: Reducing Neural Network Complexity via Iterative Pruning
作者与单位ICML_2020 新加坡
 John Tan Chong 
Min1Mehul Motani
方法和要解决的问题DropNet迭代地删除所有训练样本中具有最低平均postactivation value的节点/滤波器。
idea1.提出的DropNet&＃xff0c;是一种带重新初始化权重的迭代节点/滤波器剪枝方法&＃xff0c;它迭代地删除所有训练样本(无论是分层的还是全局的)激活后平均值最低的节点/滤波器&＃xff0c;从而降低了网络复杂度。

2与几个基准指标相比&＃xff0c;DropNet在广泛的场景中实现了有较好的鲁棒性。DropNet实现了与Oracle类似的性能&＃xff0c;后者一次贪婪地删除一个节点/滤波器&＃xff0c;以最大限度地减少训练损失。

3.DropNet不需要特殊的权重和偏差初始化(与(Frankle&Carbin&＃xff0c;2018)不同)。在随后的实验中表明&＃xff0c;剪枝模型的随机初始化将与原始初始化一样好。这意味着可以使用现成的机器学习库和硬件轻松部署DropNet删减的体系结构。
讨论作者提出的实验是探究性的&＃xff0c;只是自身的对比&＃xff0c;采用的网络也是较小的神经网络。但是是第一个提出以样本平均激活值进行剪枝的文章。
结果实验表明&＃xff0c;高达90%的节点/滤波器可以被移除&＃xff0c;而不会有任何明显的精度损失。即使在重新初始化权重和偏差的情况下&＃xff0c;最终修剪后的网络也表现良好
备注tf2.0代码开源。 

论文详细介绍

8. DMCP: Differentiable Markov Channel Pruning for Neural Networks 
题目DMCP: Differentiable Markov Channel Pruning for Neural Networks
作者与单位CVPR_2020 旷视 
Shaopeng Guo
方法和要解决的问题作者提出了一种新颖的通道剪枝方法&＃xff0c;叫做Differentiable Markov Channel Pruning (DMCP)&＃xff0c;去有效搜索最优子结构。
idea方法是可微的&＃xff0c;可以通过标准任务损失&＃xff08;交叉熵损失&＃xff09;和预算正则化&＃xff08;FLOPs和latcy限制&＃xff09;的梯度下降来直接优化。在DMCP中&＃xff0c;将通道剪枝建模为马尔可夫过程&＃xff0c;其中每个状态表示在剪枝过程中保留相应的通道&＃xff0c;状态之间的转换表示剪枝过程。最后&＃xff0c;能够通过优化转移概率后的马尔可夫过程隐式地选择每一层中合适的通道数目。为了验证该方法的有效性&＃xff0c;作者使用ResNet和MobilenetV2在Imagenet上进行了大量的实验
讨论作者采用的是空间搜索的方法&＃xff0c;利用马尔科夫过程使有效解的数量得到了下降&＃xff0c;并构造出了预算条件下的损失函数并使其变得可微&＃xff0c;采用梯度下降的方法求解。
结果实验结果表明&＃xff0c;在不同的FLOPs设置下&＃xff0c;该方法比最新的剪枝方法都能获得相当的改进。
备注代码开源tf1.x 

论文详细介绍


9. Rethinking the Value of Network Pruning 
题目Rethinking the Value of Network Pruning
作者与单位ICLR_2019 伯克利分校 
刘壮
idea1.对于已经预定义网络结构&＃xff08;每层的通道数已知&＃xff09;的修剪&＃xff0c;我们可以直接训练出一个小网络&＃xff0c;所以这时候训练一个过参数化的大模型没有什么必要。
2.作者做了很多对比实验说明了从头训练&＃xff08;随机初始化&＃xff09;的网络&＃xff08;结构化得剪枝&＃xff09;可以获得与剪枝、微调这种方法相当的精度&＃xff08;甚至更好&＃xff09;。这阐明了一个结论&＃xff0c;就是我们做剪枝是为了学习网络的结构&＃xff08;每一层的宽度&＃xff09;&＃xff0c;而不是“重要的”权重。
3.作者与The Lottery Ticket Hypothesis做了对比&＃xff0c;发现在最优学习率下&＃xff0c;Frankle&Carbin(2019年)使用的“中奖彩票”初始化并没有带来比随机初始化更好的效果。
讨论作者的实验打脸很多的结构化剪枝方法。可以把剪枝作为结构搜索。
备注代码开源 

论文详细介绍

题目	Pruning Filters for Efficient ConvNets
作者与单位	ICLR2016 美国马里兰大学 Hao Li
方法和要解决的问题	过滤器剪枝(基于feater map通道的剪枝&＃xff09; 基于幅度的权重修剪减少了来自完全连接层的大量参数&＃xff0c;并且由于修剪网络中的不规则稀疏性&＃xff0c;可能不能充分降低卷积层中的计算成本。
idea	1.对每层的滤波器进行取范数并对比大小&＃xff0c;删除其排名靠后的滤波器。主要还考虑了对应特征映射上为0的位置&＃xff0c;一并删去。 2.提出了敏感度的概念。即剪枝某层过滤器时对准确度影响小&＃xff0c;就是敏感度小&＃xff0c;可以参看:图a 3.也重点介绍了对于resnet网络的修剪&＃xff0c;所要关注的点。
讨论	这种结构化的剪枝方式&＃xff0c;不引入不规则的稀疏性。为了简化修剪&＃xff0c;使用了一次性的修剪在训练的策略。
结果	1.VGG-16 34%加速 2.ResNet-110 38%加速 3.同时通过对网络进行再训练&＃xff0c;可以恢复到接近原始精度的水平.
备注	代码开源&＃xff0c;已经阅读对vgg剪枝的代码

题目	Learning Structured Sparsity in Deep Neural Networks
作者与单位	NIPS2016 匹兹堡大学 Wei Wen
方法和要解决的问题	神经网络学习参数冗余&＃xff0c;学习更加稀疏的权值。 1.训练更加紧凑的模型&＃xff0c;节省计算开销。 2.硬件友好的结构化稀疏&＃xff0c;易于加速。 3.提供了正则化&＃xff0c;有更好的泛化能力&＃xff0c;提升精度。
idea	1. 借鉴lasso group提出了一种正则化损失函数用于对卷积层&＃xff0c;通道&＃xff0c;过滤器趋于0。
讨论	仅仅是一种L1正则化方法&＃xff0c;让更多的权值为0&＃xff0c;在移除实现模型的压缩。
结果	这种方法可以在CPU/GPU上对AlexNet分别达到平均5.1和3,1倍的加速。在CIFAR10上训练ResNet&＃xff0c;从20层减少到18层&＃xff0c;并提高了精度
备注	代码开源&＃xff0c;caffe代码 1.得到的结构化稀疏矩阵用于加速&＃xff0c;但是训练的引入的损失函数项目比较多&＃xff0c;这个方法需要额外计算新引入的和所有filters有关的梯度项&＃xff0c;这是一个问题。 2. 仅仅实验了LeNet and AlexNet. 3. 损失函数变化&＃xff0c;需要从头训练&＃xff0c;耗费时间。论文详细介绍

题目	Learning Efficient Convolutional Networks through Network Slimming
作者与单位	ICCV2017 清华大学
方法和要解决的问题	模型压缩要解决的问题 1.减小模型的大小 2.减小运行时内存的时间 3.不影响精度的同时&＃xff0c;提高计算的操作数。目前存在的问题是&＃xff1a;上篇论文提出的SSL方法缺点看备注。
idea	$L&＃61;∑(x,y)l(f(x,W),y)&＃43;λ∑γ∈Γg(γ)L&＃61;\sum_{(x, y)} l(f(x, W), y)&＃43;\lambda \sum_{\gamma \in \Gamma} g(\gamma)$ 1.我们的方法是将L1正则化施加到BN层的缩放因子上&＃xff0c;L1正则化推动BN层的缩放因子趋向于零&＃xff0c;这使得我们能够鉴别出不重要的通道或者神经元&＃xff0c;因为每一个缩放因子都和一个特定的CNN卷积通道&＃xff08;或者全连接层的一个神经元&＃xff09;相关联。 2.对跳跃连接也提出了方法
讨论	这是结构化稀疏或者剪枝不需要特别的库来实现加速
结果	该方法能够在不损失精度的情况下显著降低现有网络的计算代价(最高可达20倍)。更重要的是&＃xff0c;该方法同时减少了模型规模、运行时内存和计算运算量&＃xff0c;同时给训练过程带来了最小的开销&＃xff0c;并且所得到的模型不需要专门的库/硬件来进行有效的推理。
备注	代码开源&＃xff0c;pytorch代码代码好写&＃xff0c;但是仅仅训练过程变得简单(损失函数变得不多)&＃xff0c;但是在精度上没有特别大的进步论文详细介绍

题目	Channel Pruning for Accelerating Very Deep Neural Networks
作者与单位	ICCV2017 旷视科技
方法和要解决的问题	模型存在冗余
idea	$∥β∥0≤c\begin{array}{l}\underset{\beta, W}{\arg \min } \frac{1}{2 N}\left\\|Y-\sum_{i&＃61;1}^{c} \beta_{i} X_{i} W_{i}^{\top}\right\\|_{F}^{2} \\\text {subject to }\\|\beta\\|_{0} \leq c\end{array}$ 1. 提出了一种基于最小化特征重建误差的算法用于通道的裁制。 2. 作者对这种方法提出了两步迭代的优化算法 3. 对应用于多分支结构和和跳跃连接的也提出了额方法。
讨论	该方法是逐层进行剪枝的&＃xff0c;比较复杂&＃xff0c;其中也有需要手工的感觉&＃xff0c;而且训练阶段繁琐。
结果	修剪过的vgg16实现了5倍的加速和只有0.3%的误差增加比起最先进的结果。更重要的是&＃xff0c;该方法能够加快ResNet、Xception等现代网络的速度&＃xff0c;在2倍的速度提升下&＃xff0c;精度损失分别只有1.4%和1.0%&＃xff0c;
备注	代码开源&＃xff0c;咖啡框架组会讲解训练比较繁琐&＃xff0c;而且是两步迭代&＃xff0c;而且训练时间很长&＃xff0c;需要微调

题目	HRank&＃xff1a;Filter Pruning using High-Rank Feature Map
作者与单位	CVPR2020 厦门大学
方法和要解决的问题	总结了以往的剪枝主要分为两类 1. 通过判断属性的重要性 2. 通过适应性的属性它们的区别是&＃xff1a;第一种在训练之后进行剪枝&＃xff0c;虽然时间的复杂度降低&＃xff0c;但是也限制了加速比和压缩比。第二种方法需要将剪枝的要求嵌入到网络训练的损失&＃xff0c;但是需要重新训练&＃xff0c;比较花时间。作者提出的了一种有效且高效的滤波器剪枝方法&＃xff0c;该方法探索每一层特征图的高矩阵秩(HRank)。它是一种基于属性的修剪方法&＃xff08;第一种&＃xff0c;不用重重新训练&＃xff0c;简化了剪枝的复杂性&＃xff09;。
idea	$min⁡δij∑i&＃61;1K∑j&＃61;1niδij(wji)∑t&＃61;1gRank⁡(oji(t,:,:))\min _{\delta_{i j}} \sum_{i&＃61;1}^{K} \sum_{j&＃61;1}^{n_{i}} \delta_{i j}\left(\mathbf{w}_{j}^{i}\right) \sum_{t&＃61;1}^{g} \mathbf{R} \operatorname{ank}\left(\mathbf{o}_{j}^{i}(t,:,:)\right)$ $\sum_{j&＃61;1}^{n_{i}} \delta_{i j}&＃61;n_{i 2}$ 1. 在大量统计验证的基础上&＃xff0c;证明了单个滤波器生成的特征图的平均秩几乎没有变化。 2. 从数学上证明&＃xff0c;具有较低秩特征图的过滤器信息量较小&＃xff0c;因此对保持准确性不太重要&＃xff0c;可以首先删除这些准确性。 3. 广泛的实验证明了HRank模型压缩和加速在各种最新技术状态下的效率和效果
讨论	我感觉这一种方法是训练之后进行操作&＃xff0c;可以进行实现&＃xff0c;可以参考
结果	文章在小数据集和大数据集上进行了实验&＃xff0c;即CIFAR-10和ImageNet。研究了不同算法在主流CNN模型上的性能&＃xff0c;包括VGGNet、GoogLeNet、ResNet和DenseNet。例如&＃xff1a;使用ResNet-110&＃xff0c;通过删除59.2%的参数&＃xff0c;我们实现了58.2%的FLOPS减少&＃xff0c;而CIFAR-10的TOP-1准确率仅有0.14%的微小损失。使用ResNet-50&＃xff0c;通过删除36.7%的参数&＃xff0c;我们实现了43.8%的Flops减少&＃xff0c;而ImageNet上的TOP1准确率仅损失了1.17%。
备注	pytorch代码开源&＃xff0c;可以下一步实验。论文详细介绍

题目	Channel Pruning via Automatic Structure Search
作者与单位	IJCAI_2020 厦门大学 Mingbao Lin
方法和要解决的问题	现有的剪枝方法大多侧重于通过重要性/最优化或基于经验规则设计的正则化来选择通道(滤波器)&＃xff0c;这是次优剪枝的缺陷。
idea	`Rethinking the value of network pruning. In ICLR, 2019`论文表明&＃xff0c;通道修剪的实质在于找到最优的修剪结构&＃xff0c;即每层的通道数&＃xff0c;而不是选择“重要”的通道。为了解决深层网络中难以处理的巨大剪枝结构组合问题&＃xff0c;首先提出将保留通道限制在特定空间内的组合缩小&＃xff0c;从而大大减少剪枝结构的组合。然后&＃xff0c;将最优剪枝结构的搜索问题转化为优化问题&＃xff0c;并结合ABC算法进行自动求解&＃xff0c;以减少人为干扰。ABCPruner已经被证明是更有效的&＃xff0c;它还能够以端到端的方式高效地进行微调。
讨论	这个方法不同于先前选择那些重要的通道&＃xff0c;而是选择通道数目为优化目标&＃xff0c;也是探究的方向
结果	在CIFAR-10上进行的实验表明&＃xff0c;ABCPruner减少了73.68&＃xff05;的FLOP和88.68&＃xff05;的参数&＃xff0c;而VGGNet-16的准确度甚至提高了0.06&＃xff05;。在ILSVRC-2012上&＃xff0c;它减少了62.87&＃xff05;的FLOP&＃xff0c;并去除了60.01&＃xff05;的参数&＃xff0c;而ResNet-152的准确度损失却微不足道。
备注	pytorch代码开源&＃xff0c;可以下一步实验。论文详细介绍

题目	DropNet: Reducing Neural Network Complexity via Iterative Pruning
作者与单位	ICML_2020 新加坡 John Tan Chong Min1Mehul Motani
方法和要解决的问题	DropNet迭代地删除所有训练样本中具有最低平均postactivation value的节点/滤波器。
idea	1.提出的DropNet&＃xff0c;是一种带重新初始化权重的迭代节点/滤波器剪枝方法&＃xff0c;它迭代地删除所有训练样本(无论是分层的还是全局的)激活后平均值最低的节点/滤波器&＃xff0c;从而降低了网络复杂度。 2与几个基准指标相比&＃xff0c;DropNet在广泛的场景中实现了有较好的鲁棒性。DropNet实现了与Oracle类似的性能&＃xff0c;后者一次贪婪地删除一个节点/滤波器&＃xff0c;以最大限度地减少训练损失。 3.DropNet不需要特殊的权重和偏差初始化(与(Frankle&Carbin&＃xff0c;2018)不同)。在随后的实验中表明&＃xff0c;剪枝模型的随机初始化将与原始初始化一样好。这意味着可以使用现成的机器学习库和硬件轻松部署DropNet删减的体系结构。
讨论	作者提出的实验是探究性的&＃xff0c;只是自身的对比&＃xff0c;采用的网络也是较小的神经网络。但是是第一个提出以样本平均激活值进行剪枝的文章。
结果	实验表明&＃xff0c;高达90%的节点/滤波器可以被移除&＃xff0c;而不会有任何明显的精度损失。即使在重新初始化权重和偏差的情况下&＃xff0c;最终修剪后的网络也表现良好
备注	tf2.0代码开源。论文详细介绍

题目	DMCP: Differentiable Markov Channel Pruning for Neural Networks
作者与单位	CVPR_2020 旷视 Shaopeng Guo
方法和要解决的问题	作者提出了一种新颖的通道剪枝方法&＃xff0c;叫做Differentiable Markov Channel Pruning (DMCP)&＃xff0c;去有效搜索最优子结构。
idea	方法是可微的&＃xff0c;可以通过标准任务损失&＃xff08;交叉熵损失&＃xff09;和预算正则化&＃xff08;FLOPs和latcy限制&＃xff09;的梯度下降来直接优化。在DMCP中&＃xff0c;将通道剪枝建模为马尔可夫过程&＃xff0c;其中每个状态表示在剪枝过程中保留相应的通道&＃xff0c;状态之间的转换表示剪枝过程。最后&＃xff0c;能够通过优化转移概率后的马尔可夫过程隐式地选择每一层中合适的通道数目。为了验证该方法的有效性&＃xff0c;作者使用ResNet和MobilenetV2在Imagenet上进行了大量的实验
讨论	作者采用的是空间搜索的方法&＃xff0c;利用马尔科夫过程使有效解的数量得到了下降&＃xff0c;并构造出了预算条件下的损失函数并使其变得可微&＃xff0c;采用梯度下降的方法求解。
结果	实验结果表明&＃xff0c;在不同的FLOPs设置下&＃xff0c;该方法比最新的剪枝方法都能获得相当的改进。
备注	代码开源tf1.x 论文详细介绍

题目	Rethinking the Value of Network Pruning
作者与单位	ICLR_2019 伯克利分校刘壮
idea	1.对于已经预定义网络结构&＃xff08;每层的通道数已知&＃xff09;的修剪&＃xff0c;我们可以直接训练出一个小网络&＃xff0c;所以这时候训练一个过参数化的大模型没有什么必要。 2.作者做了很多对比实验说明了从头训练&＃xff08;随机初始化&＃xff09;的网络&＃xff08;结构化得剪枝&＃xff09;可以获得与剪枝、微调这种方法相当的精度&＃xff08;甚至更好&＃xff09;。这阐明了一个结论&＃xff0c;就是我们做剪枝是为了学习网络的结构&＃xff08;每一层的宽度&＃xff09;&＃xff0c;而不是“重要的”权重。 3.作者与The Lottery Ticket Hypothesis做了对比&＃xff0c;发现在最优学习率下&＃xff0c;Frankle&Carbin(2019年)使用的“中奖彩票”初始化并没有带来比随机初始化更好的效果。
讨论	作者的实验打脸很多的结构化剪枝方法。可以把剪枝作为结构搜索。
备注	代码开源论文详细介绍

推荐阅读

python
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
function
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
input
技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告

技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]

蜡笔小新 2024-11-07 14:33:19
import
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
ip
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44
io
超分辨率技术的全球研究进展与应用现状综述

本文综述了图像超分辨率（Super-Resolution, SR）技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率（Low-Resolution, LR）图像中恢复出高质量的高分辨率（High-Resolution, HR）图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法，包括基于传统方法和深度学习的方法，并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]

蜡笔小新 2024-10-31 15:10:48
io
如何批量删除MATLAB及其他编程语言中的注释和空行

本文介绍了如何使用Visual Studio Code、Sublime Text等编辑器批量删除MATLAB代码中的注释和空行，同时提供了一些高级技巧以确保代码的整洁。 ... [详细]

蜡笔小新 2024-11-13 11:13:30
python
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
io
关于亚像素运动估计的二次模型6之A Quadratic Prediction Based FractionalPixel Motion Estimation Algorithm for H.264

基于二次预测的H.264分数像素运动估计算法在这项研究中，提出了一种基于二次预测的H.264分数像素运动估计（ME）算法。这里ÿ ... [详细]

蜡笔小新 2024-11-12 17:53:48
process
如何在Linux服务器上配置MySQL和Tomcat的开机自动启动

在Linux服务器上部署Web项目时，通常需要确保MySQL和Tomcat服务能够随系统启动而自动运行。本文将详细介绍如何在Linux环境中配置MySQL和Tomcat的开机自启动，以确保服务的稳定性和可靠性。通过合理的配置，可以有效避免因服务未启动而导致的项目故障。 ... [详细]

蜡笔小新 2024-11-11 19:41:03
input
在CentOS 7环境中安装配置Redis及使用Redis Desktop Manager连接时的注意事项与技巧

在 CentOS 7 环境中安装和配置 Redis 时，需要注意一些关键步骤和最佳实践。本文详细介绍了从安装 Redis 到配置其基本参数的全过程，并提供了使用 Redis Desktop Manager 连接 Redis 服务器的技巧和注意事项。此外，还探讨了如何优化性能和确保数据安全，帮助用户在生产环境中高效地管理和使用 Redis。 ... [详细]

蜡笔小新 2024-11-11 18:27:44
input
深入解析国内AEB应用：摄像头和毫米波雷达融合技术的现状与前景

本文作者程建伟，武汉极目智能技术有限公司CEO，入选武汉市“光谷3551人才计划”。文章详细探讨了国内自动紧急制动（AEB）系统中摄像头与毫米波雷达融合技术的现状及未来前景。通过分析当前技术的应用情况、存在的挑战以及潜在的解决方案，作者指出，随着传感器技术的不断进步和算法优化，AEB系统的性能将大幅提升，为交通安全带来显著改善。 ... [详细]

蜡笔小新 2024-11-11 17:31:27
python
您的数据库配置是否安全？DBSAT工具助您一臂之力！

本文探讨了Oracle提供的免费工具DBSAT，该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告，DBSAT帮助用户识别潜在的安全漏洞，并提供针对性的改进建议，确保数据库系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-11-11 14:44:47
callback
深入解析Spring AOP框架中的代理对象生成机制

在前文探讨了Spring如何为特定的bean选择合适的通知器后，本文将进一步深入分析Spring AOP框架中代理对象的生成机制。具体而言，我们将详细解析如何通过代理技术将通知器（Advisor）中包含的通知（Advice）应用到目标bean上，以实现切面编程的核心功能。 ... [详细]

蜡笔小新 2024-11-06 10:11:10
io
深入解析经典卷积神经网络及其实现代码

深入解析经典卷积神经网络及其实现代码 ... [详细]

蜡笔小新 2024-11-01 11:16:09

駱宏艷_230

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章