当前位置: 开发笔记 > 后端 > 正文

《统计学习方法》第一章：基础概念与理论框架综述

作者：徐恩爱2702937105 | 来源：互联网 | 2024-11-09 13:15

第一章介绍了统计学习方法的基础概念与理论框架。1.2节详细讨论了两种模型类型：一种直接输出具体的数值结果，另一种则输出概率分布。条件概率分布描述了在给定输入$x$的情况下，多个可能输出$y$的概率分布情况，而直接输出数值的模型则为每个输入$x$提供一个确定的输出值。这一部分还探讨了这些模型在实际应用中的重要性和应用场景。

第一章

1.2节
模型有两种&＃xff0c;一种是直接输出数值&＃xff0c;另一种是输出概率。
条件概率分布是一个x对应好多y&＃xff0c;得到的是一个y的分布
输出数值是一个x输出一个y
在这里插入图片描述

1.3节
统计机器学习三要素

模型
模型集合&＃xff1a;假设空间
决策函数对应的是参数&＃xff0c;概率分布对应的是y的分布
在这里插入图片描述
策略
策略就是损失函数的设计&＃xff0c;怎么样从假设空间当中选取最合适的模型。
0/1损失函数&＃xff1a;常用语分类问题
平方损失&＃xff1a;回归问题
绝对值损失 &＃xff1a;取绝对值
二者区别&＃xff1a;平方损失对于差值更大惩罚力度更强&＃xff0c;差值更小的惩罚力度更小。灵敏度更高
对数似然损失&＃xff1a;针对于条件概率模型。P是似然函数&＃xff08;近似函数&＃xff09;&＃xff0c;log是对数函数

在这里插入图片描述
正则项&＃xff1a;关于f的函数&＃xff0c;没有给具体的形式&＃xff0c;表示的是f函数的复杂度&＃xff0c;平衡了训练稽上的经验风险和模型复杂度。我们更倾向于找到模型复杂度低&＃xff0c;经验风险小的模型&＃xff0c;。λ是模型复杂度重要程度
在这里插入图片描述
1.4节
过拟合
M是多项式最高的指数&＃xff0c;使用的是平方损失。最后一个是9次方
两个点可以有x^1直线连接&＃xff0c;三个点可以由 x ^ 2 连接…9次方一定可以连接10点穿起来&＃xff0c;但是波动大。过拟合问题。泛化能力差&＃xff0c;对噪声敏感。
在这里插入图片描述
1.5节模型选择的两个方法
经验风险&＃43;正则项
交叉验证&＃xff1a;把训练集合再进行切分 &＃61; 训练&＃43;验证

1.6 泛化能力
表示一个魔性的误差上界

推荐阅读

正则
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
正则
DLP数据泄露检测原理浅析

最近团队在部署DLP，作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么，他们都以商业秘密为由避而不谈，不得已只能自己查资料学习，于是有了下面的浅见。身为甲方，虽然不需要开发DLP产品，但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器，只有在懂这个工具的原理之后才能更加灵活地使用这个工具，即使出现意外情况也能快速排错，越接近底层，越接近真相。根据DLP的实际用途，本文将DLP检测分为2部分，泄露关键字检测和近似重复文档检测。 ... [详细]

蜡笔小新 2024-12-25 18:19:32
正则
深入解析JMeter中的JSON提取器及其应用

本文详细介绍了如何在JMeter中使用JSON提取器来获取和处理API响应中的数据。特别是在需要将一个接口返回的数据作为下一个接口的输入时，JSON提取器是一个非常有用的工具。 ... [详细]

蜡笔小新 2024-12-25 16:34:37
正则
Perl基础爬虫：从丁香园获取意大利新冠数据

本文介绍如何使用Perl编写一个简单的爬虫，从丁香园网站获取意大利的新冠病毒感染情况。通过LWP::UserAgent模块模拟浏览器访问并解析网页内容，最终提取所需数据。 ... [详细]

蜡笔小新 2024-12-25 12:06:26
正则
SQL 类似查询语句中正则表达式解析

探讨如何使用正则表达式从类 SQL 查询语句中提取字段及其对应的值。 ... [详细]

蜡笔小新 2024-12-25 11:01:15
正则
Python正则表达式re库的使用指南

本文详细介绍了如何使用Python的re库进行正则表达式匹配，特别是针对URL中的特定参数提取。适合初学者理解和应用。 ... [详细]

蜡笔小新 2024-12-24 20:00:47
cookie
百度搜索结果链接提取工具 UrlGetter V1.43

该工具专为获取百度搜索引擎的结果页面中的网址链接而设计，能够解析并转换为原始URL。通过正则表达式匹配技术，精准提取网页链接，并提供详细的使用说明和下载资源。 ... [详细]

蜡笔小新 2024-12-24 18:46:35
server
深入解析Nginx中的Location指令及其属性

本文将详细探讨Nginx配置文件中关键的location指令，包括其三种匹配方式（精准匹配、普通匹配和正则匹配），以及如何在实际应用中灵活运用这些匹配规则。此外，还将介绍location下的重要子元素如root、alias和proxy_pass，并解释相关参数的使用方法。 ... [详细]

蜡笔小新 2024-12-24 17:53:47
cookie
JavaScript 实战与基础案例解析

本文介绍了多个关于JavaScript的书籍资源、实用工具和编程实例，涵盖从入门到进阶的各个阶段，帮助读者全面提升JavaScript编程能力。 ... [详细]

蜡笔小新 2024-12-24 16:36:52
正则
基于jQuery的用户注册页面表单验证代码分享

本文介绍了一段使用jQuery实现的用户注册页面表单验证代码，适用于前端开发人员学习和参考。该示例结合了HTML、CSS和JavaScript，确保用户输入的数据格式正确。 ... [详细]

蜡笔小新 2024-12-24 14:37:46
正则
探索电路与系统的起源与发展

本文回顾了电路与系统的发展历程，从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明，还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]

蜡笔小新 2024-12-24 13:57:05
cookie
PHP 过滤器详解

本文深入探讨了 PHP 中的过滤器机制，包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时，详细介绍了各种过滤器的用途和用法。 ... [详细]

蜡笔小新 2024-12-23 19:05:02
正则
解决Python中 'NoneType' 对象无属性 'find_all' 错误

本文详细探讨了在Python编程中遇到的常见错误——'NoneType'对象没有属性'find_all'，并深入分析其原因及解决方案。通过理解find_all函数的工作原理和常见用法，帮助读者避免类似问题。 ... [详细]

蜡笔小新 2024-12-23 16:40:43
正则
C＃字符串处理如何从字符串中获取路径和args - C# string handling how get path and args from a string

Ihaveastringwithquotesaroundthepathasfollows:我在路径周围有一个带引号的字符串,如下所示:C:\ProgramFiles(x ... [详细]

蜡笔小新 2024-12-23 16:21:52
正则
在网站制作中随时可用的10个 HTML5 代码片段

HTML很容易写，但创建网页时，您经常需要重复做同样的任务，如创建表单。在这篇文章中，我收集了10个超有用的HTML代码片段，有HTML5启动模板、空白图片、打电话和发短信、自动完 ... [详细]

蜡笔小新 2024-12-23 15:26:50

徐恩爱2702937105

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章