机器学习算法线性回归

作者：涅槃WB | 来源：互联网 | 2023-10-11 13:22

线性回归线性回归解决问题基本形式线性回归目的模型计算梯度下降法求最优解代码演示--波士顿房价预估(python)线性回归算法学习记录，方便后期复习线性回归解决问题对

线性回归

- 线性回归解决问题
- 基本形式
- 线性回归目的
- 模型计算
- 梯度下降法求最优解
- 代码演示--波士顿房价预估(python)

线性回归算法学习记录&＃xff0c;方便后期复习

线性回归解决问题

对大量的观测数据进行处理&＃xff0c;从而得到比较符合事物内部规律的数学表达式。也就是说寻找到数据与数据之间的规律所在&＃xff0c;从而就可以模拟出结果&＃xff0c;也就是对结果进行预测。解决的就是通过已知的数据得到未知的结果。例如&＃xff1a;对房价的预测、判断信用评价、电影票房预估等。

基本形式

给定由d个属性描述的示例X&＃61;(x1;x2;…;xd)&＃xff0c;其中xi是X在第i个属性上的取值&＃xff0c;线性模型想要通过一个属性的线性组合来得到一个预测的函数&＃xff0c;即&＃xff1a;
f(x)&＃61;w1x1&＃43;w2x2&＃43;…&＃43;wdxd&＃43;b
一般用向量的形式可以写成&＃xff1a;
f(x)&＃61;wTX&＃43;b
其中w&＃61;(w1;w2;…;wd)&＃xff0c;&＃xff0c;当w和b学得之后&＃xff0c;模型就得以确定。

线性回归目的

在这里插入图片描述
线性回归的目的就是求解出合适的θ&＃xff0c;在一元的情况下拟合出一条直线&＃xff08;多元情况下是平面或者曲面&＃xff09;&＃xff0c;可以近似的代表各个数据样本的标签值。所以最好的直线要距离各个样本点都很接近
在这里插入图片描述
那么应该如何求得这条直线呢&＃xff1f;

模型计算

为了计算出这条直线&＃xff0c;我们引入损失函数的概念。损失函数表示的是预测值与实际值之间的不一致程度。表达式如下&＃xff1a;
在这里插入图片描述
还有另一种表达式&＃xff1a;

其中hθ(x^{(i))代表每个样本通过我们模型的预测值&＃xff0c;y}(i)代表每个样本标签的真实值&＃xff0c;m为样本个数。
我们要做的就是找到一组值&＃xff0c;将其带入损失函数后使得该损失函数的值最小。

梯度下降法求最优解

梯度下降方法就是沿着梯度下降的方向通过迭代逐步求取一个函数的最小值
通常情况下&＃xff0c;数据不可能完全符合我们的要求&＃xff0c;所以很难用矩阵去求解&＃xff0c;所以机器学习就应该用学习的方法&＃xff0c;因此我们采用梯度下降&＃xff0c;不断迭代&＃xff0c;沿着梯度下降的方向来移动&＃xff0c;求出极小值。梯度下降法包括批量梯度下降法和随机梯度下降法&＃xff08;SGD&＃xff09;以及二者的结合mini批量下降法&＃xff08;通常与SGD认为是同一种&＃xff0c;常用于深度学习中&＃xff09;。
图示如下&＃xff1a;
在这里插入图片描述

代码演示–波士顿房价预估(python)

import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.datasets import load_boston# 加载波士顿数据集 boston &＃61; load_boston()# 将数据转为pandas&＃xff0c;方便处理 boston_pd &＃61; pd.DataFrame(boston.data, columns&＃61;boston.feature_names) boston_pd[&＃39;price&＃39;] &＃61; boston.target print(boston_pd)# 绘制各属性与房屋价格的散点图&＃xff0c;分析数据相关性 for i in range(0, 9):X &＃61; boston_pd.iloc[:, i:i&＃43;1]y &＃61; boston_pd[&＃39;price&＃39;]plt.subplot(3, 3, i&＃43;1)plt.scatter(X, y)plt.xlabel(u&＃39;{}&＃39;.format(boston.feature_names[i]))plt.ylabel(u&＃39;price&＃39;)plt.title(u&＃39;{} for price&＃39;.format(boston.feature_names[i]))plt.show()# 简单线性回归数据集划分 X &＃61; np.array(boston_pd.iloc[:, 5:6]) y &＃61; np.array(boston_pd[&＃39;price&＃39;]) X_train, X_test, y_train, y_test &＃61; train_test_split(X, y, test_size&＃61;0.25)# 多元线性回归数据集划分 X_train, X_test, y_train, y_test &＃61; train_test_split(boston.data, boston.target, test_size&＃61;0.25)# 模型训练 lr &＃61; LinearRegression() lr.fit(X_train, y_train) print("权重:", lr.coef_) print("截距:", lr.intercept_) print("拟合函数:",&＃39;y&＃61;{}x1&＃43;{}x2&＃43;{}x3&＃43;{}x4&＃43;{}&＃39;.format(lr.coef_[0], lr.coef_[1], lr.coef_[2],lr.coef_[3], lr.intercept_))# 预测 price_predict &＃61; lr.predict(X_test)# 模型评估 plt.figure(figsize&＃61;(10, 6)) t &＃61; np.arange(len(X_test)) plt.plot(t, y_test, &＃39;r&＃39;, linewidth&＃61;2, label&＃61;&＃39;y_test&＃39;) plt.plot(t, price_predict, &＃39;g&＃39;, linewidth&＃61;2, label&＃61;&＃39;price_predict&＃39;) plt.legend() plt.xlabel(&＃39;test data&＃39;) plt.ylabel(&＃39;price&＃39;) plt.show()

推荐阅读

get
机器学习（ML）三之多层感知机

深度学习主要关注多层模型，现在以多层感知机（multilayerperceptron，MLP）为例，介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]

蜡笔小新 2024-11-19 19:02:28
js
OBS Studio自动化实践：利用脚本批量生成录制场景

本文探讨了如何利用OBS Studio进行高效录屏，并通过脚本实现场景的自动生成。适合对自动化办公感兴趣的读者。 ... [详细]

蜡笔小新 2024-11-21 10:44:53
process
C# 实现服务账户密码重置功能

本文详细介绍了如何使用C#实现不同类型的系统服务账户（如Windows服务、计划任务和IIS应用池）的密码重置方法。 ... [详细]

蜡笔小新 2024-11-22 21:55:10
char
binlog2sql，你该知道的数据恢复工具

binlog2sql，你该知道的数据恢复工具 ... [详细]

蜡笔小新 2024-11-22 18:58:43
get
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
get
WPF菜单控件前景与背景颜色设置指南

尽管在WPF中工作了一段时间，但在菜单控件的样式设置上遇到了一些基础问题，特别是关于如何正确配置前景色和背景色。 ... [详细]

蜡笔小新 2024-11-22 15:30:54
get
Delphi XE2 之 FireMonkey 入门(19) - TFmxObject 的子类们(表)

td{border:1pxsolid#808080;}参考:和FMX相关的类(表)TFmxObjectIFreeNotification ... [详细]

蜡笔小新 2024-11-21 22:35:24
get
JUnit下的测试和suite

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-11-21 16:03:49
get
机器学习实践：逻辑回归与过拟合控制

本文深入探讨了逻辑回归在机器学习中的应用，并详细解释了如何通过正则化等方法来有效避免模型的过拟合问题。 ... [详细]

蜡笔小新 2024-11-21 15:22:20
substring
IC卡操作功能实现

本文介绍了如何通过C#语言调用动态链接库（DLL）中的函数来实现IC卡的基本操作，包括初始化设备、设置密码模式、获取设备状态等，并详细展示了将TextBox中的数据写入IC卡的具体实现方法。 ... [详细]

蜡笔小新 2024-11-21 11:02:19
get
防范互联网服务提供商的恶意劫持行为

本文探讨了互联网服务提供商（ISP）如何可能篡改或插入用户请求的数据流，并提供了有效的技术手段来防止此类劫持行为，确保网络环境的安全与纯净。 ... [详细]

蜡笔小新 2024-11-23 09:41:45
substring
数据输入验证与控件绑定方法

本文提供了多种数据输入验证函数及控件绑定方法的实现代码，包括电话号码、数字、传真、邮政编码、电子邮件和网址的验证，以及报表绑定和自动编号等功能。 ... [详细]

蜡笔小新 2024-11-23 07:47:36
get
PHP与MySQL实现高效分页查询

本文探讨了如何在PHP与MySQL环境中实现高效的分页查询，包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]

蜡笔小新 2024-11-22 05:45:48
process
解决iOS应用推送通知错误：未找到有效aps-environment权限

在尝试加载支持推送通知的iOS应用程序的Ad Hoc构建时，遇到了‘no valid aps-environment entitlement found for application’的错误提示。本文将探讨此错误的原因及多种可能的解决方案。 ... [详细]

蜡笔小新 2024-11-21 19:26:31
import
AI炼金术：KNN分类器的构建与应用

本文介绍了如何使用Python及其相关库（如NumPy、scikit-learn和matplotlib）构建KNN分类器模型。通过详细的数据准备、模型训练及新样本预测的过程，展示KNN算法的实际操作步骤。 ... [详细]

蜡笔小新 2024-11-21 11:40:55

涅槃WB

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章