当前位置: 开发笔记 > 人工智能 > 正文

神经网络训练经验

作者：海边遗忘的时光_958 | 来源：互联网 | 2023-06-01 12:59

【静态经验】1.ResNet-503D，#param大约30+M，kinetics-400，dropout使用0.2，weightdecay使用5e-4，momentum0.9。2

【静态经验】

1. ResNet-50 3D，#param大约30+M，kinetics-400，dropout使用0.2，weight decay使用5e-4，momentum 0.9。

2. ResNet-23 2D，#param大约11M，kinetics-400，dropout使用0.5，weight decay使用1e-4， momentum0.9。

【Learning Rate】

与step调整lr相比，使用退火方式，使得训练过程更加顺滑，同时能够收敛到比较好的结果，同时更加稳定。

【Batch Size】

BN对batch size敏感，如果使用bn，则更大的batch size有利于bn更好拟合样本总体分布。

【Weight Decay】

根据目前的经验，wd和网络参数量、训练数据量有关。数据量差不多时，大网络使用大的weight decay（ResNet-50 3D，#param大约30M，kinetics-400，wd使用5e-4），小网络使用小的wd（ResNet-23 2D，#param大约11M，kinetics-400，wd使用1e-4）。

【Dropout】

根据目前的经验，小网络的do应该大，大网络的do应该小。例如ResNet-50 3D，#param大约30M，kinetics-400，do使用0.2；ResNet-23 2D，#param大约11M，kinetics-400，do使用0.5。

神经网络

推荐阅读

机器学习
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
神经网络
【Deep Learning学习笔记】Dynamic AutoEncoders for Semantic Indexing_Mirowski_NIPS2010

发表于NIPS2010workshopondeeplearning的一篇文章，看得半懂。主要内容：是针对文本表示的一种方法。文本表示可以进一步应用在文本 ... [详细]

蜡笔小新 2023-12-13 23:30:05
机器学习
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
机器学习
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
图像识别
读手语图像识别论文笔记2

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1（手语识别背景和方法）一、前言一句：“做完了&#x ... [详细]

蜡笔小新 2023-10-17 20:45:15
svm
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
nlp
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
pytorch
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
算法
概论组合最优化问题、计算复杂性和启发式算法概念（现代优化计算方法）

1.组合最优化问题定义：是通过数学方法的研究去寻找离散事件的最优编排、分组、次序或筛选等。描述：最优化问题的数学模型的一般描述是，x为决策 ... [详细]

蜡笔小新 2023-10-17 18:23:43
ocr
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
svm
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
机器人
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
机器人
ICRA2019最佳论文 Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio

文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议：ICRA2019标题：《MakingSenseofVision ... [详细]

蜡笔小新 2023-10-17 12:49:25
机器学习
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
神经网络
如何知道一个网络中每个权重的重要性

如图所示B可以看做是网络的权重,A是输入,C是输出,要想知道网络的权重,只需将,B中的其中一个权重设置为0,如果权重的改变没有对结果造成很大的影响,说明该权重没有影响,神经网络是 ... [详细]

蜡笔小新 2023-10-17 09:30:30

海边遗忘的时光_958

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章