热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

最通俗的解释牛顿法与梯度下降法数学公式推导过程

 牛顿法与梯度下降法数学公式推导过程迭代更新数学公式推导过程1、牛顿法首先对于有n个变量的函数的一阶导数为: 其次对于其二阶导数为: 之后关于目标函
 牛顿法与梯度下降法数学公式推导过程

迭代更新数学公式推导过程

1、牛顿法

首先对于有n个变量的函数的一阶导数为

         《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

其次对于其二阶导数为:

         《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

之后关于目标函数的包含二阶导数的泰勒展开式为:

         《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

这时将《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》看成《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》的函数,则根据函数的最小值性质,当偏导数等于0时出取得,从而得到《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》,所以《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》根据等式的特点得到,只有两者都取0时才能使等式等于0,所以得:  

    《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》(最小值)

     《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》 《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》 《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

    《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

         《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

故牛顿法的迭代公式为:

       《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

2、梯度下降法

在开始推导之前,来介绍一下一个概念:梯度(当前函数位置的导数),同时它也表示某一函数在该点处的方向导数沿着该方向取得较大值。

       梯度:《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

  之后这里给出一阶泰勒展开式

           《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

由于《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》都是矢量,则《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》也是矢量,则根据矢量与向量的关系,这时我们可以用一个单位向量V(下一步将要变化的方向)与标量的乘积来表示:《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》,而《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

便是我们所说的步进长度。这时《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》表达式为:《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

又由我们的目的出发,所以可以我们希望通过这个迭代变化使《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》小,以此达到最小值。所以由公式《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》,当梯度方向《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》成反方向时,能最大程度的朝着局部下降的方向变化,使《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》取得最大值。根据《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》的数学关系,这时可以得出《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》的计算关系:《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》(一般情况,单位向量都是正向的)

    《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

    《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》(由于是标量,可以把它与步进长度合到一起)

     《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》

故梯度下降法的迭代公式为:

     《最通俗的解释--牛顿法与梯度下降法数学公式推导过程》 


推荐阅读
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 深入理解K近邻分类算法:机器学习100天系列(26)
    本文详细介绍了K近邻分类算法的理论基础,探讨其工作原理、应用场景以及潜在的局限性。作为机器学习100天系列的一部分,旨在为读者提供全面且深入的理解。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • 随着生活节奏的加快和压力的增加,越来越多的人感到不快乐。本文探讨了现代社会中导致人们幸福感下降的各种因素,并提供了一些改善建议。 ... [详细]
  • Python中HOG图像特征提取与应用
    本文介绍如何在Python中使用HOG(Histogram of Oriented Gradients)算法进行图像特征提取,探讨其在目标检测中的应用,并详细解释实现步骤。 ... [详细]
  • Python 工具推荐 | PyHubWeekly 第二十一期:提升命令行体验的五大工具
    本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具,涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]
  • LambdaMART算法详解
    本文详细介绍了LambdaMART算法的背景、原理及其在信息检索中的应用。首先回顾了LambdaMART的发展历程,包括其前身RankNet和LambdaRank,然后深入探讨了LambdaMART如何结合梯度提升决策树(GBDT)和LambdaRank来优化排序问题。 ... [详细]
  • 在互联网信息爆炸的时代,当用户需求模糊或难以通过精确查询表达时,推荐系统成为解决信息过载的有效手段。美团作为国内领先的O2O平台,通过深入分析用户行为,运用先进的机器学习技术优化推荐算法,提升用户体验。 ... [详细]
  • 机器学习公开课备忘录(三)机器学习算法的应用与大数据集
    机器学习公开课备忘录(三)机器学习算法的应用与大数据集对应机器学习公开课第六周和第10周机器学习算法模型的选择与评价1、对于一个data,可以将data划分为trainingset、t ... [详细]
  • 支持向量机(SVM)是一种基于统计学习理论的模型,主要在VC维和结构风险最小化的理论基础上发展而来。本文将探讨几种不同的SVM方法及其优化策略,旨在提高模型的效率和适用性。 ... [详细]
  • 题目描述:给定n个半开区间[a, b),要求使用两个互不重叠的记录器,求最多可以记录多少个区间。解决方案采用贪心算法,通过排序和遍历实现最优解。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
author-avatar
万世一统_425
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有