当前位置: 开发笔记 > 后端 > 正文

改善深层神经网络：超参数调整、正则化以及优化——3.2为超范围

作者：骏天天在线 | 来源：互联网 | 2023-08-18 10:08

上一节已经看到，在超参数范围内，随机取值可以提升搜索效率，但随机取值并不是在有效范围内的随机均匀取值，而是选择合适的标尺用于

上一节已经看到&＃xff0c;在超参数范围内&＃xff0c;随机取值可以提升搜索效率&＃xff0c;但随机取值并不是在有效范围内的随机均匀取值&＃xff0c;而是选择合适的标尺用于探究超参数。

假设要选取隐藏单元的数量 $n^{[l]}$ &＃xff0c;对于给定层&＃xff0c;假设选择的取值范围是从50到100中某点&＃xff0c;这种情况下&＃xff0c;对于50-100的数轴&＃xff0c;可以随机在其上取点&＃xff0c;这是一个搜索特定超参数的很直观的方式。

或者如果要选取神经网络的层数&＃xff0c;称之为字母L&＃xff0c;也许会选择层数为2到4中的某个值&＃xff0c;接着顺着2,3,4随机均匀取样才比较合理&＃xff0c;还可以应用网格搜索。这是集合随机均匀取值的例子。

但这对于某些超参数是不适用的&＃xff0c;假设在搜索超参数 $α\alpha$ 学习速率&＃xff0c;假设其值最小是0.0001&＃xff0c;或者最大值是1&＃xff0c;如果画一条从0.0001到1的数轴&＃xff0c;沿其随机均匀取值&＃xff0c;那么90%的数值将会落在0.1到1之间&＃xff0c;结果就是在0.1到1之间应用了90%的资源&＃xff0c;而在0.0001到0.1之间只有10%的搜索资源&＃xff0c;这看上去不太对&＃xff0c;反而用对数标尺搜索超参数的方式会更合理&＃xff0c;因此这里不使用线性轴&＃xff0c;分别依次取0.0001&＃xff0c;0.001&＃xff0c;0.01&＃xff0c;1&＃xff0c;在对数轴上均匀随机取点&＃xff0c;这样在0.0001到0.001之间就会有更多的搜索资源可&＃xff0c;还有在0.001到0.01之间等等。分别取对数可以得到0.0001-1之间的对数范围是-4-0&＃xff0c;然后可以设置 $α\alpha$ 的值&＃xff0c;基于随机取样的超参数值 $α&＃61;10r\alpha&＃61;10^r$ 。所以总结一下&＃xff0c;在对数坐标上取值&＃xff0c;取最小值的对数得到a值&＃xff0c;取最大值的对数得到b值&＃xff0c;所以现在在对数轴上的 $10^a$ 到 $10^b$ 区间取值&＃xff0c;在a和b之间随机均匀的选取r值&＃xff0c;将超参数设置为 $10^r$ &＃xff0c;这就是在对数轴上取值的过程。

最后&＃xff0c;另一个棘手的例子是给 $β\beta$ 取值&＃xff0c;用于计算指数的加权平均值&＃xff0c;假设 $β\beta$ 是从0.9到0.999之间的某个值。请记住这一点&＃xff0c;当计算指数的加权平均值时&＃xff0c;取0.9就像在10个值中计算平均值&＃xff0c;有点类似于计算10天的温度平均值&＃xff0c;而取0.999就是在1000个值中取平均。如果想在0.9到0.999区间搜索&＃xff0c;就不能用线性轴取值&＃xff0c;所以考虑这个问题最好的方法就是探究 $1−β1-\beta$ &＃xff0c;此值在0.1到0.001区间内&＃xff0c;所以我们会给 $1−β1-\beta$ 取值&＃xff0c;采用对数轴&＃xff0c;0.1的对数取值为-1&＃xff0c;0.001的对数取值为-1。这里设定了 $1−β&＃61;10r1-\beta&＃61;10^r$ &＃xff0c;所以 $β&＃61;1−10r\beta&＃61;1-10^r$ &＃xff0c;然后这就变成了超参数随机取值。

推荐阅读

http
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
http
深入理解 H5C3 和 JavaScript 核心问题

本文详细探讨了 H5C3 和 JavaScript 中的一些核心编程问题，通过实例解析和代码示例，帮助开发者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-12-26 18:28:05
http
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
http
百度搜索结果链接提取工具 UrlGetter V1.43

该工具专为获取百度搜索引擎的结果页面中的网址链接而设计，能够解析并转换为原始URL。通过正则表达式匹配技术，精准提取网页链接，并提供详细的使用说明和下载资源。 ... [详细]

蜡笔小新 2024-12-24 18:46:35
http
探索电路与系统的起源与发展

本文回顾了电路与系统的发展历程，从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明，还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]

蜡笔小新 2024-12-24 13:57:05
http
解决Python中 'NoneType' 对象无属性 'find_all' 错误

本文详细探讨了在Python编程中遇到的常见错误——'NoneType'对象没有属性'find_all'，并深入分析其原因及解决方案。通过理解find_all函数的工作原理和常见用法，帮助读者避免类似问题。 ... [详细]

蜡笔小新 2024-12-23 16:40:43
http
智能车间调度研究进展

本文综述了基于强化学习的智能车间调度策略，探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段，解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]

蜡笔小新 2024-12-22 19:02:54
http
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
http
实用正则表达式有哪些

小编给大家分享一下实用正则表达式有哪些，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下 ... [详细]

蜡笔小新 2024-12-22 13:59:04
http
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
http
Java中罗马数字计算器的字符验证与循环输入处理

本文介绍如何在Java中实现一个罗马数字计算器，重点在于如何通过循环和字符验证确保用户输入合法。我们将探讨创建一个方法来检查字符串中的非法字符，并使用循环不断提示用户输入，直到输入符合要求。 ... [详细]

蜡笔小新 2024-12-20 16:02:02
http
Google排名优化－面向Google(Search Engine Friendly)的URL设计

Google排名优化－面向Google(Search Engine Friendly)的URL设计 ... [详细]

蜡笔小新 2024-12-19 16:16:50
api
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
http
解决Uploadify在IE浏览器中的兼容性问题

本文详细介绍了如何解决Uploadify插件在Internet Explorer（IE）9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码，确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]

蜡笔小新 2024-12-27 22:07:40
http
JMeter接口关联与数据提取：正则表达式和JSON Extractor的使用

在使用JMeter进行接口测试时，常常需要从前一个接口的响应中提取数据并应用于后续请求。本文将详细介绍如何利用正则表达式提取器（Regular Expression Extractor）和JSON Extractor来实现这一需求。 ... [详细]

蜡笔小新 2024-12-19 16:31:21

骏天天在线

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章