【机器学习系列】变分推断第三讲：基于随机梯度上升法SGD的变分推断解法

作者：卢健波_785 | 来源：互联网 | 2023-08-08 15:24

作者：CHEONG公众号：AI机器学习与知识图谱研究方向：自然语言处理与知识图谱阅读本文之前，首先注意以下两点：

作者&＃xff1a;CHEONG

公众号&＃xff1a;AI机器学习与知识图谱

研究方向&＃xff1a;自然语言处理与知识图谱

阅读本文之前&＃xff0c;首先注意以下两点&＃xff1a;

1. 机器学习系列文章常含有大量公式推导证明&＃xff0c;为了更好理解&＃xff0c;文章在最开始会给出本文的重要结论&＃xff0c;方便最快速度理解本文核心。需要进一步了解推导细节可继续往后看。

2. 文中含有大量公式&＃xff0c;若读者需要获取含公式原稿Word文档&＃xff0c;可关注公众号【AI机器学习与知识图谱】后回复&＃xff1a;变分推断第三讲&＃xff0c;可添加微信号【17865190919】进学习交流群&＃xff0c;加好友时备注来自CSDN。原创不易&＃xff0c;转载请告知并注明出处&＃xff01;

本文将先对变分推断所要解决的问题进行分析&＃xff0c;然后给出基于随机梯度上升法的变分推断解法。

一、本文结论

结论1&＃xff1a; 变分推断的主要思想&＃xff1a;在给定数据集 $X$ 下&＃xff0c;问题是求后验概率 $p$ &＃xff0c;简单情况下后验概率 $p$ 可直接通过贝叶斯公式推导求出&＃xff0c;但有些情况无法直接求解。因此变分推断想法是先假设另一个简单的概率分布 $q$ &＃xff0c;如高斯分布&＃xff0c;通过优化 $p$ 和 $q$ 之间距离最小化&＃xff0c;让概率分布 $q$ 逼近 $p$ &＃xff0c;这样就可以用概率分布 $q$ 近似表示后验概率 $p$ 。

结论2&＃xff1a; 基于随机梯度上升法主要思路就是对优化的目标函数 $q^*&＃61;argmax_qELBO$ 求梯度的过程。最后使用MCMC采样的方式近似求出梯度&＃xff0c;并且考虑到求解出梯度近似值的稳定性&＃xff0c;使用了重参数化技巧Reparameterization Trick。在梯度求出之后便可使用迭代方式求出参数。

二、问题分析

在上一节详细介绍了变分推断所要解决的问题&＃xff0c;下面我们首先重新明确优化的目标函数

在这里插入图片描述

其中&＃xff1a;

在这里插入图片描述

为了表示方便&＃xff0c;这里假设 $q (z)$ 中 $z$ 是关于参数 $ϕ\phi$ 的函数&＃xff0c;这样优化函数就变成&＃xff1a;

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RYM5IxiA-1617961098543)(file:///C:/Users/zl_sd/AppData/Local/Temp/msohtmlclip1/01/clip_image024.png)]

在明确了优化函数后&＃xff0c;接下来就通过随机梯度上升法求解&＃xff0c;因此下面通过公式推导求求梯度。

三、公式推导

下面是 $L(ϕ)L(\phi)$ 关于 $ϕ\phi$ 求梯度的过程&＃xff1a;

在这里插入图片描述

这里为了方便表示&＃xff0c;做以下赋值操作&＃xff0c;用 $A$ 表示公式前半部分&＃xff0c;用 $B$ 表示公式后半部分&＃xff1a;

在这里插入图片描述

先看 $B$ 项&＃xff0c;其中 $logpθ(x,z)logp_\theta(x,z)$ 与 $L(ϕ)L(\phi)$ 无关&＃xff0c;所以有&＃xff1a;

在这里插入图片描述

所以最终化简可得 $B$ 项为0&＃xff0c;所以原始公式就只剩下 $A$ 项&＃xff1a;

在这里插入图片描述

所以可以将上述式子写成 $qϕq_\phi$ 期望的形式如下&＃xff1a;

在这里插入图片描述

这样我们就将 $L(ϕ)L(\phi)$ 关于 $ϕ\phi$ 的梯度求出来了&＃xff0c;是一个关于 $qϕq_\phi$ 的期望&＃xff0c;就可以通过MCMC采样的方式把梯度具体表示出来&＃xff0c;知道了梯度便可以利用梯度上升法进行求解了。首先通过MCMC采样法对 $z$ 进行采样&＃xff0c; $zl∼qϕ,l&＃61;1,2,...,Lz^l \sim q_{\phi}, l&＃61;1,2,...,L$ &＃xff0c;得到 $L(ϕ)L(\phi)$ 关于 $ϕ\phi$ 的梯度为&＃xff1a;

在这里插入图片描述

知道梯度后便可以通过随机梯度上升法求解参数&＃xff1a;

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pbvehGlq-1617961098615)(file:///C:/Users/zl_sd/AppData/Local/Temp/msohtmlclip1/01/clip_image064.png)]

但这里存在一个问题&＃xff0c;问题就出在&＃xff1a;

在这里插入图片描述

当 $qϕq_\phi$ 很小时&＃xff0c;如在0-1之间时&＃xff0c;log函数的结果就会有很大的波动&＃xff0c;会导致求出来的梯度值有很大的波动&＃xff0c;这样MCMC采样时只有让 $L$ 取非常大时才能避免这种波动带来的高方差High Variance的问题&＃xff0c;所以在实际使用时存在工程上的问题。解决的方案就是使用重参数化技巧来避免。

四、重参数化技巧

Reparameterization Trick&＃xff0c;假设&＃xff1a;

在这里插入图片描述

其中

在这里插入图片描述

则&＃xff1a;

在这里插入图片描述

在使用重参数化技巧之后&＃xff0c;我们再来求目标函数的梯度值&＃xff1a;

在这里插入图片描述

这里将 $qϕq_\phi$ 可以利用重参数化技巧可以等价替换成 $p(ε)p(\varepsilon)$ &＃xff1a;

在这里插入图片描述

这里就是关于 $p(ε)p(\varepsilon)$ 的期望了&＃xff0c;所以对 $ϕ\phi$ 求梯度时就不会那么复杂

在这里插入图片描述

这里我们再使用MCMC采样法对 $ε\varepsilon$ 进行采样&＃xff0c; $εl∼p(ε),l&＃61;1,2,...,L\varepsilon^l \sim p(\varepsilon), l&＃61;1,2,...,L$ &＃xff0c;最终可以得出目标函数的梯度值为&＃xff1a;

在这里插入图片描述

得知梯度值之后&＃xff0c;便可以使用随机梯度上升法对参数进行迭代求解&＃xff1a;

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aMNGRNor-1617961098694)(file:///C:/Users/zl_sd/AppData/Local/Temp/msohtmlclip1/01/clip_image064.png)]

推荐阅读

python
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
python
推荐：以数据驱动的方式讲故事

直觉vs数据首先，你有思考过一个问题吗？当你的直觉与你所掌握的数据矛盾的时候，你是听从于直觉还是相信你所掌握的数据呢？201 ... [详细]

蜡笔小新 2023-10-16 17:51:26
python
聊聊中国人工智能科技产业区域竞争力分析及趋势

原文链接：聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数（2021ÿ ... [详细]

蜡笔小新 2023-10-13 11:56:40
ip
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
ip
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
ip
深度学习与神经网络——邱锡鹏

深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络：一种以（人工)）神经元为基本单元的模型深度学习：一类机器学习问题，主要解决贡献度分配问题知识结构：路线图：顶 ... [详细]

蜡笔小新 2023-10-16 05:57:42
ip
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29
ip
Android中高级面试必知必会，积累总结

本文介绍了Android中高级面试的必知必会内容，并总结了相关经验。文章指出，如今的Android市场对开发人员的要求更高，需要更专业的人才。同时，文章还给出了针对Android岗位的职责和要求，并提供了简历突出的建议。 ... [详细]

蜡笔小新 2023-12-14 14:53:02
ip
如何基于ggplot2构建相关系数矩阵热图以及一个友情故事

本文介绍了如何在rstudio中安装ggplot2，并使用ggplot2构建相关系数矩阵热图。同时，通过一个友情故事，讲述了真爱难觅的故事背后的数据量化和皮尔逊相关系数的概念。故事中的小伙伴们在本科时参加各种考试，其中有些沉迷网络游戏，有些热爱体育，通过他们的故事，展示了不同兴趣和特长对学习和成绩的影响。 ... [详细]

蜡笔小新 2023-12-14 10:47:00
ip
拥抱Android Design Support Library新变化（导航视图、悬浮ActionBar）

转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一，为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]

蜡笔小新 2023-12-13 16:11:00
ip
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
ip
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
ip
NLP如何进阶？你应该先掌握四大基本任务！

“语言理解是人工智能领域皇冠上的明珠。”——比尔盖茨自然语言处理是一门综合性的学问，它远远不止机器学习算法。相比图像或语音，文本的变化更加复杂ÿ ... [详细]

蜡笔小新 2023-10-16 05:43:05
ip
如何用R语言做词云图，以某部网络小说为例

作者：horoR语言中文社区专栏作者知乎ID：https:www.zhihu.compeoplelin-jia-chuan前言一开始，我在 ... [详细]

蜡笔小新 2023-10-13 16:42:04
python
python结构化程序设计风格_Python自然语言处理04 编写结构化程序

前言4.1回到基础赋值(略)barfoo[:]copy.deepcopy()等式(略)is条件语句ifelifall()any()4.2序列字符串链表元组序列类型上的操作表4-1P ... [详细]

蜡笔小新 2023-10-13 16:40:29

卢健波_785

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章