热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python过拟合实例分析

本篇内容介绍了“python过拟合实例分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何

本篇内容介绍了“python过拟合实例分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

如下图便直观形象的展示出这种最严重的的过拟合情况:

python过拟合实例分析 

模型几乎拟合所有点,也就是在训练集上的准确度接近 100%,这类模型有什么特点呢?不妨看看这个模型的参数:

        1.24700471e-13, -2.35752755e-11,  2.06759733e-09, -1.11665116e-07,
        4.15722794e-06, -1.13161697e-04,  2.33087852e-03, -3.70886530e-02,
        4.61321531e-01, -4.50943817e+00,  3.46373724e+01, -2.07949995e+02,
        9.65158102e+02, -3.40164962e+03,  8.85765503e+03, -1.63366853e+04,
        1.99303609e+04, -1.41930185e+04,  4.37094529e+03,  2.87198980e+00

一共有 20 个,正好等于需要拟合的点数。

以上图形是用拉格朗日插值方法拟合出来的,借助 scipy 包完成插值,代码如下所示。

数据准备阶段:

from scipy.interpolate import lagrange
import numpy as np
import matplotlib.pyplot as plt

#使用样本个数
n = 20

# seed 保证每次都生成一个固定随机数
np.random.seed(2)
eps = np.random.rand(n) * 2

# 构造样本数据
x = np.linspace(0, 20, n)
y = np.linspace(2, 14, n) + eps

调用拉格朗日插值,得到插值函数 p,然后输入待插值点 x, 完成插值得到插值点(xx,yy)

# 调用拉格朗日插值,得到插值函数p
p = lagrange(x, y)
xx = x
yy = p(xx)

拉格朗日插值得到一个多项式模型,参数个数等于样本个数。

以上我们还原拟合所有样本点的一个方法。

机器学习中为了模型泛化能力更强,所以需要简化模型参数,换句话说对参数做正则化处理,这也符合奥卡姆剃刀定律,即简单有效原理。

常用的L1 正则会使参数稀疏化,它会将其中一些参数权重归 0. 当然就今天将要拟合的数据点而言,直接简化模型参数为 2个,拟合效果就不会差。

选用 sklearn 最最简单的线型回归模型:

from sklearn import linear_model
reg = linear_model.LinearRegression()
reg.fit(x.reshape(len(x),-1),y)

# 得到2个参数值
reg.coef_,reg.intercept_
(array([0.62182096]), 2.644854261121125)

再plot下拟合效果:

plt.figure(figsize=(12,8))
plt.scatter(x, y, color="r")
# 拉格朗日插值复杂模型
plt.plot(xx, yy, color="b",label='lagrange')
# 线型回归极简模型
plt.plot(xx,xx*reg.coef_+reg.intercept_,color='green',label='linear_model')
plt.show()
 
python过拟合实例分析

“python过拟合实例分析”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程笔记网站,小编将为大家输出更多高质量的实用文章!


推荐阅读
  • Python 异步编程:深入理解 asyncio 库(上)
    本文介绍了 Python 3.4 版本引入的标准库 asyncio,该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio,以及它如何简化并发编程的复杂性,并详细介绍其核心概念和使用方法。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文将介绍由密歇根大学Charles Severance教授主讲的顶级Python入门系列课程,该课程广受好评,被誉为Python学习的最佳选择。通过生动有趣的教学方式,帮助初学者轻松掌握编程基础。 ... [详细]
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文详细探讨了Java中的24种设计模式及其应用,并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类,帮助开发者更好地理解和应用这些模式,提升代码质量和可维护性。 ... [详细]
  • 本文基于刘洪波老师的《英文词根词缀精讲》,深入探讨了多个重要词根词缀的起源及其相关词汇,帮助读者更好地理解和记忆英语单词。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • Android 渐变圆环加载控件实现
    本文介绍了如何在 Android 中创建一个自定义的渐变圆环加载控件,该控件已在多个知名应用中使用。我们将详细探讨其工作原理和实现方法。 ... [详细]
  • 本文深入探讨了如何通过调整InnoDB的关键配置参数来优化MySQL的随机IO性能,涵盖了缓存、日志文件、预读机制等多个方面,帮助读者全面提升数据库系统的性能。 ... [详细]
  • 扫描线三巨头 hdu1928hdu 1255  hdu 1542 [POJ 1151]
    学习链接:http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想,后期可以求解很 ... [详细]
  • 本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法,通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点,并保持在文档树中。 ... [详细]
author-avatar
xl466581836
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有