当前位置: 开发笔记 > 编程语言 > 正文

太赞了！借助可视化，最直观理解梯度，以及偏导数、方向导数和法向量等

作者：海带木耳求_529 | 来源：互联网 | 2023-07-29 10:19

点上方蓝字计算机视觉联盟获取更多干货在右上方设为星标★，与你不见不散仅作学术分享，不代表本公众号立场，侵权联系删除转载于：作

点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★&＃xff0c;与你不见不散

仅作学术分享&＃xff0c;不代表本公众号立场&＃xff0c;侵权联系删除

转载于&＃xff1a;作者丨shine-lee&＃64;博客园

来源丨https://www.cnblogs.com/shine-lee/p/11715033.html

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源&＃xff01;可打印版本附pdf下载链接

写在前面

梯度是微积分中的基本概念&＃xff0c;也是机器学习解优化问题经常使用的数学工具&＃xff08;梯度下降算法&＃xff09;&＃xff0c;虽然常说常听常见&＃xff0c;但其细节、物理意义以及几何解释还是值得深挖一下&＃xff0c;这些不清楚&＃xff0c;梯度就成了“熟悉的陌生人”&＃xff0c;仅仅“记住就完了”在用时难免会感觉不踏实&＃xff0c;为了“用得放心”&＃xff0c;本文将尝试直观地回答以下几个问题&＃xff0c;

梯度与偏导数的关系&＃xff1f;
梯度与方向导数的关系&＃xff1f;
为什么说梯度方向是上升最快的方向&＃xff0c;负梯度方向为下降最快的方向&＃xff1f;
梯度的模有什么物理意义&＃xff1f;
等高线图中绘制的梯度为什么垂直于等高线&＃xff1f;
全微分与隐函数的梯度有什么关系&＃xff1f;
梯度为什么有时又成了法向量&＃xff1f;

闲话少说&＃xff0c;书归正传。在全篇“作用域”内&＃xff0c;假定函数可导。

偏导数

在博文《单变量微分、导数与链式法则》&＃xff08;https://www.cnblogs.com/shine-lee/p/10324601.html&＃xff09;中&＃xff0c;我们回顾了常见初等函数的导数&＃xff0c;概括地说&＃xff0c;

导数是一元函数的变化率&＃xff08;斜率&＃xff09;。导数也是函数&＃xff0c;是函数的变化率与位置的关系。

如果是多元函数呢&＃xff1f;则为偏导数。

偏导数是多元函数“退化”成一元函数时的导数&＃xff0c;这里“退化”的意思是固定其他变量的值&＃xff0c;只保留一个变量&＃xff0c;依次保留每个变量&＃xff0c;则

元函数有

个偏导数。

以二元函数为例&＃xff0c;令

&＃xff0c;绘制在3维坐标系如下图所示&＃xff0c;

在分别固定

和

的取值后得到下图中的黑色曲线——“退化”为一元函数&＃xff0c;二维坐标系中的曲线——则偏导数

和

分别为曲线的导数&＃xff08;切线斜率&＃xff09;。

由上可知&＃xff0c;一个变量对应一个坐标轴&＃xff0c;偏导数为函数在每个位置处沿着自变量坐标轴方向上的导数&＃xff08;切线斜率&＃xff09;。

方向导数

如果是方向不是沿着坐标轴方向&＃xff0c;而是任意方向呢&＃xff1f;则为方向导数。如下图所示&＃xff0c;点

位置处红色箭头方向的方向导数为黑色切线的斜率&＃xff0c;来自链接

Directional Derivative

https://www.geogebra.org/m/Bx8nFMNc

方向导数为函数在某一个方向上的导数&＃xff0c;具体地&＃xff0c;定义

平面上一点(

以及单位向量

在曲面

上&＃xff0c; 从点

出发&＃xff0c;

沿

方向走

单位长度后&＃xff0c; 函数值

为则点

处

方向的方向导数为 :

上面推导中使用了链式法则。其中&＃xff0c;

和

分别为函数在

位置的偏导数。由上面的推导可知&＃xff1a;

该位置处&＃xff0c;任意方向的方向导数为偏导数的线性组合&＃xff0c;系数为该方向的单位向量。当该方向与坐标轴正方向一致时&＃xff0c;方向导数即偏导数&＃xff0c;换句话说&＃xff0c;偏导数为坐标轴方向上的方向导数&＃xff0c;其他方向的方向导数为偏导数的合成。

写成向量形式&＃xff0c;偏导数构成的向量为称之为梯度

梯度

梯度&＃xff0c;写作

二元时为

多元时为

。

我们继续上面方向导数的推导&＃xff0c;

处

方向上的方向导数为

其中&＃xff0c;

为

与

的夹角&＃xff0c;显然&＃xff0c;当

即

与梯度

同向时&＃xff0c;方向导数取得最大值&＃xff0c;最大值为梯度的模

当

即

与梯度

反向时&＃xff0c;方向导数取得最小值&＃xff0c;最小值为梯度模的相反数。此外根据上面方向导数的公式可知&＃xff0c;在夹角

时方向导数为正&＃xff0c;表示

方向函数值上升&＃xff0c;

时方向导数为负, 表示该方向函数值下降。

至此&＃xff0c;方才有了梯度的几何意义&＃xff1a;

当前位置的梯度方向&＃xff0c;为函数在该位置处方向导数最大的方向&＃xff0c;也是函数值上升最快的方向&＃xff0c;反方向为下降最快的方向&＃xff1b;
当前位置的梯度长度&＃xff08;模&＃xff09;&＃xff0c;为最大方向导数的值。

等高线图中的梯度

在讲解各种优化算法时&＃xff0c;我们经常看到目标函数的等高线图示意图&＃xff0c;如下图所示&＃xff0c;来自链接

Applet: Gradient and directional derivative on a mountain

https://mathinsight.org/applet/gradient_directional_derivative_mountain

图中&＃xff0c;红点为当前位置&＃xff0c;红色箭头为梯度&＃xff0c;绿色箭头为其他方向&＃xff0c;其与梯度的夹角为

。

将左图中

曲面上的等高线投影到

平面&＃xff0c;得到右图的等高线图。

梯度与等高线垂直。为什么呢?

等高线&＃xff0c;顾名思义&＃xff0c;即这条线上的点高度&＃xff08;函数值&＃xff09;相同&＃xff0c;令某一条等高线为

C为常数&＃xff0c;两边同时全微分&＃xff0c;如下所示

这里&＃xff0c;两边同时全微分的几何含义是&＃xff0c;在当前等高线上挪动任意一个极小单元&＃xff0c;等号两侧的变化量相同。

的变化量有两个来源&＃xff0c;一个由x的变化带来&＃xff0c;另一个由y的变化带来&＃xff0c;在一阶情况下&＃xff0c;由

带来的变化量为

由

带来的变化量为

两者叠加为z的总变化量&＃xff0c;等号右侧为常数&＃xff0c;因为我们指定在当前等高线上挪动一个极小单元&＃xff0c;其变化量为0&＃xff0c;左侧等于右侧。进一步拆分成向量内积形式&＃xff0c;(

)为梯度&＃xff0c;

为该点指向任意方向的极小向量&＃xff0c;因为两者内积为0&＃xff0c;所以两者垂直。自然不难得出梯度与等高线垂直的结论。

更进一步地&＃xff0c;梯度方向指向函数上升最快的方向&＃xff0c;在等高线图中&＃xff0c;梯度指向高度更高的等高线。

隐函数的梯度

同理&＃xff0c;对于隐函数

也可以看成是一种等高线。二元时&＃xff0c;两边同时微分&＃xff0c;梯度垂直于曲线&＃xff0c;多元时&＃xff0c;两边同时微分&＃xff0c;梯度垂直于高维曲面。

即&＃xff0c;隐函数的梯度为其高维曲面的法向量。

有了法向量&＃xff0c;切线或切平面也就不难计算得到了。令曲线

上一点为

通过全微分得该点的梯度为

则该点处的切线为

相当于将上面的微分向量

替换为

其几何意义为法向量垂直切平面上的任意向量。

小结

至此&＃xff0c;文章开篇几个问题的答案就不难得出了&＃xff0c;

偏导数构成的向量为梯度&＃xff1b;
方向导数为梯度在该方向上的合成&＃xff0c;系数为该方向的单位向量&＃xff1b;
梯度方向为方向导数最大的方向&＃xff0c;梯度的模为最大的方向导数&＃xff1b;
微分的结果为梯度与微分向量的内积
等高线全微分的结果为0&＃xff0c;所以其梯度垂直于等高线&＃xff0c;同时指向高度更高的等高线
隐函数可以看成是一种等高线&＃xff0c;其梯度为高维曲面&＃xff08;曲线&＃xff09;的法向量

以上。

参考

Gradients and Partial Derivatives
Directional Derivative
Applet: Gradient and directional derivative on a mountain
Gradient descent
Gradient
Partial derivative
ppt Partial derivative

end

这是我的私人微信&＃xff0c;还有少量坑位&＃xff0c;可与相关学者研究人员交流学习

目前开设有人工智能、机器学习、计算机视觉、自动驾驶&＃xff08;含SLAM&＃xff09;、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群&＃xff0c;备注&＃xff1a;CV联盟

王博的公众号&＃xff0c;欢迎关注&＃xff0c;干货多多

王博的系列手推笔记&＃xff08;附高清PDF下载&＃xff09;&＃xff1a;

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机&＃xff08;上&＃xff09;

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机&＃xff08;下&＃xff09;

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类&＃xff08;上&＃xff09;

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类&＃xff08;下&＃xff09;

博士笔记 | 周志华《机器学习》手推笔记第八章&＃xff08;上&＃xff09;

博士笔记 | 周志华《机器学习》手推笔记第八章&＃xff08;下&＃xff09;

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

推荐阅读

java
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
java
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
eval
机器学习算法：SVM（支持向量机）

SVM算法（SupportVectorMachine，支持向量机）的核心思想有2点：1、如果数据线性可分，那么基于最大间隔的方式来确定超平面，以确保全局最优， ... [详细]

蜡笔小新 2024-11-14 04:33:58
rsa
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
rsa
深入浅出解读奇异值分解，助你轻松掌握核心概念

深入浅出解读奇异值分解，助你轻松掌握核心概念 ... [详细]

蜡笔小新 2024-11-03 15:12:45
java
Python与R语言的功能对比及应用场景分析

Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性，但Python作为一种通用编程语言，适用于更广泛的领域，包括Web开发、自动化脚本和机器学习等。对于初学者而言，Python的学习曲线更为平缓，上手更加容易。此外，Python拥有庞大的社区支持和丰富的第三方库，使其在实际应用中更具灵活性和扩展性。 ... [详细]

蜡笔小新 2024-11-01 18:37:10
int
当人工智能（AI）撞上供应链

了解供应链简单来说，供应链涉及一系列旨在向最终用户提供产品或服务的步骤。企业组织及其供应商之间始终存在一个网络，来生产特定产品并将其交付给最终用户。该网络包括不同的活动、人员、实体 ... [详细]

蜡笔小新 2024-10-11 18:25:31
java
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
java
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
java
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
range
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
range
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
range
当前物联网领域十大核心技术解析：涵盖哪些关键技术？

经过近十年的技术革新，物联网已悄然渗透到日常生活中，对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术，包括但不限于：1. 军事物联网技术，该技术通过先进的感知设备实现战场环境的实时监测与数据传输，提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等，这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]

蜡笔小新 2024-11-05 19:25:03
rsa
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
int
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44

海带木耳求_529

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章