当前位置: 开发笔记 > 编程语言 > 正文

拯救万千学子于水深火热之中！Facebook开源无梯度优化工具

作者：前世梦0708 | 来源：互联网 | 2023-10-13 15:46

乾明发自凹非寺量子位出品|公众号QbitAI机器学习啥最苦？十有八九找参数！不少研究生，都被卡在这个环节上，久久不能毕业。现

乾明发自凹非寺
量子位出品 | 公众号 QbitAI

机器学习啥最苦&＃xff1f;十有八九找参数&＃xff01;

不少研究生&＃xff0c;都被卡在这个环节上&＃xff0c;久久不能毕业。

现在&＃xff0c;圣诞节前&＃xff0c;有了一个好消息&＃xff01;

Facebook宣布&＃xff0c;开源自家一直在使用的无梯度优化工具&＃xff1a;Nevergrad。

640?wx_fmt&＃61;gif

并“信誓旦旦”表示&＃xff0c;这能让调整模型参数和超参数的过程变得更快、更容易。

但在Twitter上&＃xff0c;仿佛起到了相反的效果。

有人看到这个消息之后&＃xff0c;立马“梗”上心头&＃xff1a;

NeverGraduate吗&＃xff1f;

也有人调侃称&＃xff0c;这绝对是那些博士读了6年的人心中的噩梦。

640?wx_fmt&＃61;png

不过&＃xff0c;调侃归调侃&＃xff0c;人家可是货真价实的NeverGradient。

大多数人还是用转发、点赞表达了自己的态度。

640?wx_fmt&＃61;png

这是个什么东东&＃xff1f;

简单来说&＃xff0c; 这是一个Python 3库&＃xff0c;里面有很多不需要进行梯度计算的算法。这些算法有&＃xff1a;

差分进化
序列二次规划
FastGA
协方差矩阵自适应
用于噪声管理的种群控制方法
粒子群优化
……

它们都呈现在了一个标准的ask-and-tell Python框架中&＃xff0c;同时&＃xff0c;Facebook还配备了相关的测试和评估工具。

有没有一种热泪盈眶的感觉&＃xff1f;

640?wx_fmt&＃61;png

先别急……来看看效果怎么样。

拿起来就能用

就先从上面提到的算法来说吧。之前这些算法都是定制的&＃xff0c;想要比较一个任务中各种算法的性能&＃xff1f;要么行不通&＃xff0c;要么得花大力气。

Facebook表示&＃xff0c;有了Nevergrad&＃xff0c;这些都不是问题。只要有用得着它的地方&＃xff0c;拿起来就能用。

不仅能够比较不同方法的性能&＃xff0c;还能与那些常用基准上的最先进水平进行比较&＃xff0c;以及帮你为特定的用例找最好的优化方法。

640?wx_fmt&＃61;jpeg

应用场景很感人

先说Facebook的情况。博文中说&＃xff0c;自家的研究团队已经在强化学习、图像生成以及各种各样的项目中使用Nevergrad了。

而且&＃xff0c;Nevergrad的无梯度优化&＃xff0c;还能广泛运用于各种机器学习问题。比如&＃xff1a;

多模态问题&＃xff0c;比如有几个最小值的问题。 (例如&＃xff0c;语言建模深度学习的超参数化。)
病态问题&＃xff0c;在试图优化几个具有非常不同动态的变量时&＃xff0c;通常会出现这种问题。(例如&＃xff0c;没有针对具体问题重新标定dropout和学习率。)
可分离或旋转的问题&＃xff0c;包括部分旋转的问题。
部分可分离问题&＃xff0c;可以考虑通过几个变量块来解决。例子包括对深度学习或其他形式设计的架构搜索&＃xff0c;以及多任务网络的参数化。
离散、连续或混合的问题。这些任务需要同时选择每层的学习速率、每层的权重衰减以及每层的非线性类型。
有噪声的问题&＃xff0c;当使用完全相同的参数调用函数时&＃xff0c;函数可以返回不同的结果&＃xff0c;例如强化学习中的独立事件。

来&＃xff0c;总结一下。

在机器学习中&＃xff0c;Nevergrad可来调整超参数&＃xff0c;如学习速率、动量、权重衰减(可能是每层)、 dropout和深层网络的每一部分的层参数等。

但从无梯度方法的角度来说&＃xff0c;它也可以应用到电网管理、航空、镜头设计以及许多其他科学和工程中。

为了证明Nevergrad的能力。Facebook的团队使用 Nevergrad 实现了几个基准测试。

硬核示例&＃xff1a;用Nevergrad生成算法基准

不同的例子对应于不同的设置(是否多模态&＃xff0c;是否有噪声&＃xff0c;是否离散&＃xff0c;是否病态) &＃xff0c;并展示了如何使用Nevergrad确定最佳优化算法。

在每个基准测试中&＃xff0c;他们对不同的x值进行了独立的实验。这确保了方法之间在几个x值上的一致排名具有统计学意义。

640?wx_fmt&＃61;png

△噪声最优化示例

这个示例显示&＃xff0c;使用pcCMSA - ES的噪声管理方法的TBPSA优于其他几种替代方案。

具体怎么比较的&＃xff0c;Facebook在GitHub上开源了&＃xff0c;传送门在文末。

Nevergrad也可以处理离散的目标函数&＃xff0c;在许多机器学习案例中都会遇到这个问题。

例如&＃xff0c;在有限的选项集(如神经网络中的激活函数)之间进行选择&＃xff0c;以及在不同类型的层之间进行选择(例如&＃xff0c;决定在网络中的某个位置是否需要跳过连接)。

现有的一些工具&＃xff0c;比如Bbob和Cutest不包含任何离散的基准测试。但Nevergrad可以处理离散域。

方法有两个&＃xff0c;一是通过softmax函数(将离散问题转化为有噪声的连续问题)&＃xff0c;二是通过连续变量的离散化。

Facebook还专门做了一个测试。

640?wx_fmt&＃61;png

如上图&＃xff0c;测试中FastGA在这种情况下表现最好。有一点&＃xff0c;DoubleFastGA对应于1/dim和( dim - 1 ) / dim之间的突变率&＃xff0c;而不是1/dim和1/2。这是因为&＃xff0c;原始范围对应的是一个二进制域&＃xff0c;而在这里&＃xff0c;Facebook考虑的是任意域。

好&＃xff0c;到此&＃xff0c;该说的都说了。

请收好传送门吧~

传送门

Nevergrad项目地址&＃xff1a;

https://github.com/facebookresearch/nevergrad

博客地址&＃xff1a;

https://code.fb.com/ai-research/nevergrad/

噪声最优化示例项目地址&＃xff1a;

https://github.com/facebookresearch/nevergrad/blob/master/docs/benchmarks.md

作者系网易新闻·网易号“各有态度”签约作者

— 完 —

加入社群

量子位AI社群开始招募啦&＃xff0c;欢迎对AI感兴趣的同学&＃xff0c;在量子位公众号&＃xff08;QbitAI&＃xff09;对话界面回复关键字“交流群”&＃xff0c;获取入群方式&＃xff1b;

此外&＃xff0c;量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募&＃xff0c;面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号&＃xff08;QbitAI&＃xff09;对话界面回复关键字“专业群”&＃xff0c;获取入群方式。&＃xff08;专业群审核较严&＃xff0c;敬请谅解&＃xff09;

诚挚招聘

量子位正在招募编辑/记者&＃xff0c;工作地点在北京中关村。期待有才气、有热情的同学加入我们&＃xff01;相关细节&＃xff0c;请在量子位公众号(QbitAI)对话界面&＃xff0c;回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ&＃39;ᴗ&＃39; ի 追踪AI技术和产品新动态

640?wx_fmt&＃61;gif

△ 好看吗&＃xff1f;↘↘↘

推荐阅读

go
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
search
Python 工具推荐 | PyHubWeekly 第二十一期：提升命令行体验的五大工具

本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具，涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]

蜡笔小新 2024-12-21 14:45:11
go
全能终端工具推荐：高效、免费、易用

介绍一款备受好评的全能型终端工具——MobaXterm，它不仅功能强大，而且完全免费，适合各类用户使用。 ... [详细]

蜡笔小新 2024-12-16 21:02:15
go
智慧城市建设现状及未来趋势

随着新基建政策的推进及‘十四五’规划的实施，我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型，促进数字政府建设，新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计，以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]

蜡笔小新 2024-12-16 16:43:21
rsa
移动 UI 设计基础：打造简洁高效的用户界面

本章将深入探讨移动 UI 设计的核心原则，帮助开发者构建简洁、高效且用户友好的界面。通过学习设计规则和用户体验优化技巧，您将能够创建出既美观又实用的移动应用。 ... [详细]

蜡笔小新 2024-12-27 08:43:40
input
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
lua
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
instance
LambdaMART算法详解

本文详细介绍了LambdaMART算法的背景、原理及其在信息检索中的应用。首先回顾了LambdaMART的发展历程，包括其前身RankNet和LambdaRank，然后深入探讨了LambdaMART如何结合梯度提升决策树（GBDT）和LambdaRank来优化排序问题。 ... [详细]

蜡笔小新 2024-12-18 12:30:35
search
黑客如何利用AI在暗网重建你的数字身份

随着技术的发展，黑客开始利用AI技术在暗网中创建用户的‘数字孪生’，这一现象引起了安全专家的高度关注。 ... [详细]

蜡笔小新 2024-12-12 17:45:26
search
微创新的力量：如何通过细微改变实现产品革新

探讨为何大多数程序员难以晋升为架构师，并分析创新是否必须颠覆现有规则。本文基于《微创新：5种微小改变创造伟大产品》一书，深入解析创新的体系化方法及具体策略。 ... [详细]

蜡笔小新 2024-12-05 13:10:52
go
Manta Network 携手 Axelar 推动跨链隐私保护

Web3隐私协议Manta Network与区块链互操作性平台Axelar达成战略合作，共同推进跨链资产的隐私保护。 ... [详细]

蜡笔小新 2024-11-28 18:20:12
search
FTX 闪崩，4 小时暴跌 80%，熊市的最后一跌？区块链已死？

FTX 闪崩，4 小时暴跌 80%，熊市的最后一跌？区块链已死？ ... [详细]

蜡笔小新 2024-11-26 17:21:32
search
macOS系统及其关键功能解析

本文详细介绍了macOS系统的核心组件，包括如何管理其安全特性——系统完整性保护（SIP），并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说，了解这些信息有助于更好地管理和优化系统性能。 ... [详细]

蜡笔小新 2024-12-26 18:05:04
input
使用Vultr云服务器和Namesilo域名搭建个人网站

本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站，包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南，帮助读者顺利完成建站过程。 ... [详细]

蜡笔小新 2024-12-26 16:36:34
search
CATIA二次开发开源项目：CATSearch插件

CATSearch是一个针对CATIA V5和3DEXPERIENCE平台的开源二次开发项目，由硬核小青年发起并维护。该项目旨在解决3DE搜索功能不稳定的问题，通过API调用提供更快速、准确的搜索体验。本文将详细介绍该插件的功能及使用方法。 ... [详细]

蜡笔小新 2024-12-26 12:02:28