当前位置: 开发笔记 > 编程语言 > 正文

贝叶斯定理与机器学习

作者：丫头2502892725 | 来源：互联网 | 2023-09-18 11:08

文章目录概率运算贝叶斯公式贝叶斯推理三门问题[^1]贝叶斯推理与机器学习泰勒展开假设的重要性奥卡姆剃刀[^2]决策理论概率运算求事件A或B发生的概率：A⋃B→P(A

文章目录

- 概率运算
- 贝叶斯公式
- 贝叶斯推理
- - - 三门问题 [^1]
- 贝叶斯推理与机器学习
- - - 泰勒展开
    - 假设的重要性
    - 奥卡姆剃刀[^2]
    - 决策理论

概率运算

求事件A或B发生的概率&＃xff1a; $\bigcup B \to P(A&＃43;B) &＃61; P(A)&＃43;P(B)$
求事件A且B发生的概率&＃xff1a; $\bigcap B \to P(A,B) &＃61; P(A)P(B)$
求事件A不发生的概率&＃xff1a; $Aˉ→P(Aˉ)&＃61;1−P(A)\bar A \to P(\bar A) &＃61; 1 - P(A)$
求在事件B发生的条件下&＃xff0c;事件A发生的概率&＃xff1a; $P (A ∣ B) &＃61; P (A, B) / P (B)$
求在事件A发生的条件下&＃xff0c;事件B的概率&＃xff1a; $P (B ∣ A) &＃61; P (A, B) / P (A)$
全概率公式&＃xff1a; $&＃43;P(A|\bar B)P(\bar B)$

贝叶斯公式

$\over {P(B|A)p(A) &＃43;P(B|\bar A)P(\bar A)}}$

证明
$P (A, B) &＃61; P (B, A)$
${P(A|B)P(B)} &＃61; {P(B|A)P(A)}$
$\over {p(B)}}$
$\over {p(B|A)P(A)&＃43;P(B|\bar A)P(\bar A)}}$

其中B代表着证据或是数据&＃xff0c;A代表着事件&＃xff0c;P(A)称之为先验概率&＃xff0c;P(A|B)称之为后验概率。

贝叶斯推理

三门问题 ¹

问题&＃xff1a;
参赛者会看见三扇关闭了的门&＃xff0c;其中一扇的后面有一辆汽车或者是奖品&＃xff0c;选中后面有车的那扇门就可以赢得该汽车或奖品&＃xff0c;而另外两扇门后面则各藏有一隻山羊。当参赛者选定了一扇门&＃xff0c;但未去开启它的时候&＃xff0c;知道门后情形的节目主持人会开启剩下两扇门的其中一扇&＃xff0c;露出其中一隻山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是&＃xff1a;换另一扇门会否增加参赛者赢得汽车的机率&＃xff1f;

求证
假设你已经选择了门1
开门前&＃xff1a;
设门1,2,3后有车的概率分别为 $P (1), P (2), P (3)$ ,选中车概率为&＃xff1a; $\over 3}$ ,其中的 $P (n)$ 为先验概率
开门后&＃xff1a;
$\over {p(3|2)P(2)&＃43;P(3|1)P(1)&＃43;&＃43;P(3|3)P(3)}}$
$\cdot {1\over 3}\over {1 \cdot {1 \over 3}&＃43;{{1 \over 2} \cdot{1 \over 3}}&＃43;{0 \cdot {1 \over 3}}}}$
$\over 3}$
$\over 3}$
因为 $,所以选择换门。$

贝叶斯推理与机器学习

泰勒展开

任何函数都可以以泰勒展开式拟合。

假设对 $f (x)$ 的拟合函数有如下四个

$f1(x):Y&＃61;W1→拟合得最差f_1(x) :Y &＃61; W_1 \to 拟合得最差$
$f2(x):Y&＃61;W1X&＃43;B→拟合的极差f_2(x):Y&＃61;W_1X&＃43;B \to 拟合的极差$
$f_3(x):Y&＃61;W_1X^3&＃43;W_2X^2&＃43;W_3X^1&＃43;B 拟合的很好$
$f4(x):Y&＃61;W1X10&＃43;W2X9&＃43;⋯&＃43;W10X1B→完全拟合f_4(x):Y&＃61;W_1X^{10}&＃43;W_2X^9&＃43;\cdots &＃43;W_{10}X^1B \to 完全拟合$

假设的重要性

过拟合问题
虽然函数 $f_4(x)$ 在训练集上完全拟合&＃xff0c; $C o s t &＃61; 0$ ,但是在测试集上表现上确有很大的误差&＃xff0c;这便是过拟合问题。

泛化误差
上文提到的在测试集上的误差&＃xff0c;便是泛化误差。我们求得的最佳拟合函数&＃xff0c;应该满足泛化误差最小。

贝叶斯错误率
在求得最小泛化误差的同时&＃xff0c;我们需要使拟合函数的训练误差接近贝叶斯错误率。

奥卡姆剃刀²

根据定义&＃xff0c;任何假设都会带来犯错误概率的增加&＃xff1b;如果一个假设不能增加理论的正确率&＃xff0c;那么它的唯一作用就是增加整个理论为错误的概率

在如上的四个拟合函数中&＃xff0c;在能解释问题的情况下&＃xff0c;我们选择有3个参数的 $f_3(x)$ 函数。因为假设越多&＃xff0c;参数越多&＃xff0c;则这个函数就越脆弱。

修改代价函数
修改前: $\over m}\Sigma(Y-Y_p)^2$
修改后: $\over m}\Sigma(Y-Y_p)^2 &＃43;f(m)$
举例&＃xff1a; $\over m}\Sigma(Y-Y_p)^2 &＃43;(W_1^2&＃43;W_2^2&＃43;\cdots &＃43;W_m^2)$
将代价函数增加了一项关于模型的函数&＃xff0c;在模型趋向于复杂时&＃xff0c;代价函数值也相应增加

决策理论

https://zh.wikipedia.org/zh/蒙提霍爾問題 ↩︎
https://zh.wikipedia.org/zh-hans/奥卡姆剃刀 ↩︎

推荐阅读

java
提升 Kubernetes 集群管理效率的七大专业工具

Kubernetes 在云原生环境中的应用日益广泛，然而集群管理的复杂性也随之增加。为了提高管理效率，本文推荐了七款专业工具，这些工具不仅能够简化日常操作，还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查，这些工具覆盖了集群管理的各个方面，帮助管理员更好地应对挑战。 ... [详细]

蜡笔小新 2024-11-07 17:01:31
java
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
java
a16z深入解析：代币设计的常见误区、优化策略及未来趋势分析

a16z深入解析：代币设计的常见误区、优化策略及未来趋势分析 ... [详细]

蜡笔小新 2024-11-06 14:52:58
less
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
less
基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装

一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012，引入SQLServer2012群集提高高可用性，需要对SQLServ ... [详细]

蜡笔小新 2024-11-13 15:49:49
java
JUC（三）：深入解析AQS

本文详细介绍了Java并发工具包中的核心类AQS（AbstractQueuedSynchronizer），包括其基本概念、数据结构、源码分析及核心方法的实现。 ... [详细]

蜡笔小新 2024-11-13 15:40:34
java
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
java
解决Only fullscreen opaque activities can request orientation错误的方法

本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误，并提供了一种有效的解决方案。 ... [详细]

蜡笔小新 2024-11-13 09:46:25
uri
应用链时代，详解 Avalanche 与 Cosmos 的差异

应用链时代，详解 Avalanche 与 Cosmos 的差异 ... [详细]

蜡笔小新 2024-11-13 09:37:19
uri
Linux CentOS 7 安装PostgreSQL 9.5.17 （源码编译）

近日需要将PostgreSQL数据库从Windows中迁移到Linux中，LinuxCentOS7安装PostgreSQL9.5.17安装过程特此记录。安装环境&#x ... [详细]

蜡笔小新 2024-11-12 22:05:03
char
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
format
非线性门控感知器算法的实现与应用分析

非线性门控感知器算法的实现与应用分析 ... [详细]

蜡笔小新 2024-11-11 12:19:17
range
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
range
机器学习中的标准化缩放、最小-最大缩放及鲁棒缩放技术解析

机器学习中的标准化缩放、最小-最大缩放及鲁棒缩放技术解析 ... [详细]

蜡笔小新 2024-11-05 15:46:18
future
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42