热门标签 | HotTags
当前位置:  开发笔记 > 前端 > 正文

001线性回归

如果有一组样本要根据以后的x1,x2来预测以后未知的y相当于拟合一个由θ1x1,θ2x2的平面hθ(x)来估计Y值是偏置项如

如果有一组样本

要根据以后的x1,x2来预测以后未知的y

相当于拟合一个由θ1x1,θ2x2的平面hθ(x)来估计Y值

是偏置项

如果样本的特征无限增多,也就是x项有n多个

相当于

令x0=1

则有

 

矩阵比较高效,需要转换为矩阵,则

化为矩阵:

 

预测值和真实值之间必定存在误差

则设,误差为:

则每个样本的实际值为:

 

的概率密度服从正态分布,独立并且相同分布

均值为0,方差为

则此处的μ为0,

独立:每一组x的误差都与另外一组x的误差无关

相同分布:属于同一组数据或同一个作用域或x来自于同样一个地方的

因为服从高斯分布

则:

 

因为:

则:

 

 

似然函数:根据样本来估计参数值,也就是说,什么样的参数跟数据组合后恰好是真实值

目标是让越小越好,也就是说,让真实值和估计值越接近越好,或者是真实值与估计值相同的概率越高越好

累乘关系,为什么是累乘?

因为这里是要满足所有样本数据,相当于与的关系 ,

因为前面说,误差的均值是0,并且满足高斯分布,

那么高斯分布在均值处,概率最大,均为为0,误差为0

也就是说所有的误差分布的概率相乘之后,越大越好,对应的点就是误差为0

 

对数似然:为什么要取对数?因为加法比乘法简单

 

 

因为:

则可以化为:

化简:

前面说过,越大越好

可看做常数而且为正数

则让最小

就可以有最大

 

称为最小二乘法

真实值减去预测值的函数,

这里也说明,真实值减去预测值越小越好,得到的误差最小的概率也就越大,

这里一直是概率问题,不是实际误差值

这里的θ,x,y都是矩阵

展开后化简为:

这里矩阵X,y都是已知量

则对θ求偏导,导数为0时,有θ最小值

有θ最小值

 

X就是样本,Y也是样本

则可以求出θ

 

评估方法:

残差平方和越小越好,也就是真实值和预测值越接近,

越接近1,就说明这个模型是越好的

 

 

 

 

数学不要过一遍,用到哪里去看哪里就行,过一遍也不一定全都能记住。

 

唐宇迪机器学习视频笔记——线性回归算法原理推导

 

转:https://www.cnblogs.com/Mjerry/p/9643505.html



推荐阅读
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 本文详细介绍了 BERT 模型中 Transformer 的 Attention 机制,包括其原理、实现代码以及在自然语言处理中的应用。通过结合多个权威资源,帮助读者全面理解这一关键技术。 ... [详细]
  • QUIC协议:快速UDP互联网连接
    QUIC(Quick UDP Internet Connections)是谷歌开发的一种旨在提高网络性能和安全性的传输层协议。它基于UDP,并结合了TLS级别的安全性,提供了更高效、更可靠的互联网通信方式。 ... [详细]
  • 深入理解OAuth认证机制
    本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准,旨在为第三方应用提供安全的用户资源访问授权,同时确保用户的账户信息(如用户名和密码)不会暴露给第三方。 ... [详细]
  • QBlog开源博客系统:Page_Load生命周期与参数传递优化(第四部分)
    本教程将深入探讨QBlog开源博客系统的Page_Load生命周期,并介绍一种简洁的参数传递重构方法。通过视频演示和详细讲解,帮助开发者更好地理解和应用这些技术。 ... [详细]
  • PyCharm下载与安装指南
    本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境(IDE),涵盖Windows、macOS和Linux系统,同时提供详细的安装步骤及配置建议。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 本文详细介绍了如何使用Python编写爬虫程序,从豆瓣电影Top250页面抓取电影信息。文章涵盖了从基础的网页请求到处理反爬虫机制,再到多页数据抓取的全过程,并提供了完整的代码示例。 ... [详细]
  • 本文深入探讨 MyBatis 中动态 SQL 的使用方法,包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
author-avatar
唯爱WE创丶
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有