当前位置: 开发笔记 > 编程语言 > 正文

deeplearningtutorial学习笔记

作者：zhihong520珠珠_448 | 来源：互联网 | 2023-10-12 09:54

DeeplearningTutorialcs231n讲义，作业whydeepisbetter?ChoosingProperLossdropoutdr

Deep learning Tutorial

cs231n 讲义，作业

why deep is better?

Choosing Proper Loss

dropout

dropout is kind of ensembel

Why CNN for Image

卷积核处理后的尺寸：Feature Map 的尺寸等于（input_size+ 2 * padding_size-filter_size） / stride +1

cross-validation strategy

coarse -> fine cross-validation in stages

first stage: only a few epochs to get rough idea of what params work
second stage: longer running time,finer search.. repeat as necessary
tip for detecting explosions in the solver: if the cost is ever > 3*original cost ,break out early

relu

adagrad, adam

# Adam
m = beta1*m + (1-beta1)*dx      # update first moment
v = beta2*v + (1-beta2)*(dx**2) # update second moment
x += -learning_rate * m / (np.sqrt(v) + 1e-7) 

# Adam
m,v =  # ... initialize caches to zeros
for t in  xrange(0, big_number):
    dx = # ... evaluate gradient
    m = beta1 * m + (1-beta1) * dx
    v = beta2 * v + (1-beta2) * (dx**2)
    m /= 1-beta1**t     # correct bias
    v /= 1-beta2**t     # correct bias
    x += -learning_rate * m / ( np.sqrt(v) + 1e-7)

# Adagrad update
cache += dx**2
x += -learning_rate * dx / ( np.sqrt(cache) + 1e-7 )

# RMSProp
cache = decay_rate * cache + ( 1 - decay_rate) * (dx**2)
x += -learning_rate * dx / ( np.sqrt(cache) + 1e-7 )

batch normalization

RNN

推荐阅读

web
服务器虚拟化存储设计,完美规划储存与资源，部署高性能虚拟化桌面

规划部署虚拟桌面环境前，必须先估算目前所使用实体桌面环境的工作负载与IOPS性能，并慎选储存设备。唯有谨慎估算贴近实际的IOPS性能，才能 ... [详细]

蜡笔小新 2024-11-22 19:12:09
post
如何在没有提交按钮的情况下提交HTML表单？

探讨了在HTML表单中使用元素代替进行表单提交的方法。 ... [详细]

蜡笔小新 2024-11-22 17:48:42
search
WPF菜单控件前景与背景颜色设置指南

尽管在WPF中工作了一段时间，但在菜单控件的样式设置上遇到了一些基础问题，特别是关于如何正确配置前景色和背景色。 ... [详细]

蜡笔小新 2024-11-22 15:30:54
install
解决iOS应用推送通知错误：未找到有效aps-environment权限

在尝试加载支持推送通知的iOS应用程序的Ad Hoc构建时，遇到了‘no valid aps-environment entitlement found for application’的错误提示。本文将探讨此错误的原因及多种可能的解决方案。 ... [详细]

蜡笔小新 2024-11-21 19:26:31
install
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
install
ASP.NET 进度条实现详解

本文介绍了如何在ASP.NET中使用HTML和JavaScript创建一个动态更新的进度条，并通过Default.aspx页面进行展示。 ... [详细]

蜡笔小新 2024-11-22 15:00:08
install
使用RxJS在AngularJS中区分单击与拖动操作

本文探讨了如何利用RxJS库在AngularJS应用中实现对用户单击和拖动操作的精确区分，特别是在调整区域大小的场景下。 ... [详细]

蜡笔小新 2024-11-22 11:56:41
install
Windows蓝屏故障代码解析与解决方法

在测试软件或进行系统维护时，有时会遇到电脑蓝屏的情况，即便使用了沙盒环境也无法完全避免。本文将详细介绍常见的蓝屏错误代码及其解决方案，帮助用户快速定位并解决问题。 ... [详细]

蜡笔小新 2024-11-22 11:46:53
install
使用jQuery操作多个div的显示与隐藏

本文介绍了如何利用jQuery实现对网页上多个div元素的显示与隐藏控制，包括基本的toggle方法及更复杂的显示隐藏逻辑。 ... [详细]

蜡笔小新 2024-11-21 19:38:53
foreach
如何使用 org.apache.tinkerpop.gremlin.structure.VertexProperty 的 key 方法

本文详细介绍了 `org.apache.tinkerpop.gremlin.structure.VertexProperty` 类中的 `key()` 方法，并提供了多个实际应用的代码示例。通过这些示例，读者可以更好地理解该方法在图数据库操作中的具体用途。 ... [详细]

蜡笔小新 2024-11-21 17:38:10
format
OBS Studio自动化实践：利用脚本批量生成录制场景

本文探讨了如何利用OBS Studio进行高效录屏，并通过脚本实现场景的自动生成。适合对自动化办公感兴趣的读者。 ... [详细]

蜡笔小新 2024-11-21 10:44:53
substring
web: _show -> _info 造轮子编程

问题场景用Java进行web开发过程当中，当遇到很多很多个字段的实体时，最苦恼的莫过于编辑字段的查看和修改界面，发现2个页面存在很多重复信息，能不能写一遍？有没有轮子用都不如自己造。解决方式笔者根据自 ... [详细]

蜡笔小新 2024-11-21 10:21:24
web
使用Service Locator模式实现高效的服务命名访问

本文探讨了如何通过Service Locator模式来简化和优化在B/S架构中的服务命名访问，特别是对于需要频繁访问的服务，如JNDI和XMLNS。该模式通过缓存机制减少了重复查找的成本，并提供了对多种服务的统一访问接口。 ... [详细]

蜡笔小新 2024-11-20 19:26:30
web
HDU 2028: 扩展最小公倍数问题

本题要求计算一组正整数的最小公倍数（LCM）。输入包括多组测试数据，每组数据首先给出一个正整数n，随后是n个正整数。 ... [详细]

蜡笔小新 2024-11-20 15:52:47
post
C# 中创建和执行存储过程的方法

本文详细介绍了如何使用 C# 创建和调用 SQL Server 存储过程，包括连接数据库、定义命令类型、设置参数等步骤。 ... [详细]

蜡笔小新 2024-11-19 19:55:59

zhihong520珠珠_448

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

deeplearningtutorial学习笔记

dropout is kind of ensembel

卷积核处理后的尺寸：Feature Map 的尺寸等于（input_size+ 2 * padding_size-filter_size） / stride +1

coarse -> fine cross-validation in stages

first stage: only a few epochs to get rough idea of what params work

second stage: longer running time,finer search.. repeat as necessary

tip for detecting explosions in the solver: if the cost is ever > 3*original cost ,break out early