热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

贝叶斯定理与机器学习

文章目录概率运算贝叶斯公式贝叶斯推理三门问题[^1]贝叶斯推理与机器学习泰勒展开假设的重要性奥卡姆剃刀[^2]决策理论概率运算求事件A或B发生的概率:A⋃B→P(A


文章目录

    • 概率运算
    • 贝叶斯公式
    • 贝叶斯推理
        • 三门问题 [^1]
    • 贝叶斯推理与机器学习
        • 泰勒展开
        • 假设的重要性
        • 奥卡姆剃刀[^2]
        • 决策理论


概率运算


  1. 求事件A或B发生的概率:A⋃B→P(A+B)=P(A)+P(B)A \bigcup B \to P(A+B) = P(A)+P(B)ABP(A+B)=P(A)+P(B)
  2. 求事件A且B发生的概率:A⋂B→P(A,B)=P(A)P(B)A \bigcap B \to P(A,B) = P(A)P(B)ABP(A,B)=P(A)P(B)
  3. 求事件A不发生的概率:Aˉ→P(Aˉ)=1−P(A)\bar A \to P(\bar A) = 1 - P(A)AˉP(Aˉ)=1P(A)
  4. 求在事件B发生的条件下,事件A发生的概率:P(A∣B)=P(A,B)/P(B)P(A|B) = P(A,B)/P(B)P(AB)=P(A,B)/P(B)
  5. 求在事件A发生的条件下,事件B的概率:P(B∣A)=P(A,B)/P(A)P(B|A) = P(A,B)/P(A)P(BA)=P(A,B)/P(A)
  6. 全概率公式:P(A)=P(A∣B)P(B)+P(A∣Bˉ)P(Bˉ)P(A) = P(A|B)P(B) +P(A|\bar B)P(\bar B)P(A)=P(AB)P(B)+P(ABˉ)P(Bˉ)

贝叶斯公式

P(A∣B)=P(B∣A)P(A)P(B∣A)p(A)+P(B∣Aˉ)P(Aˉ)P(A|B) = {P(B|A)P(A) \over {P(B|A)p(A) +P(B|\bar A)P(\bar A)}}P(AB)=P(BA)p(A)+P(BAˉ)P(Aˉ)P(BA)P(A)

证明
P(A,B)=P(B,A)P(A,B) = P(B,A)P(A,B)=P(B,A)
P(A∣B)P(B)=P(B∣A)P(A){P(A|B)P(B)} = {P(B|A)P(A)}P(AB)P(B)=P(BA)P(A)
P(A∣B)=P(B∣A)P(A)p(B)P(A|B) = {P(B|A)P(A) \over {p(B)}}P(AB)=p(B)P(BA)P(A)
P(A∣B)=P(B∣A)P(A)p(B∣A)P(A)+P(B∣Aˉ)P(Aˉ)P(A|B) = {P(B|A)P(A) \over {p(B|A)P(A)+P(B|\bar A)P(\bar A)}}P(AB)=p(BA)P(A)+P(BAˉ)P(Aˉ)P(BA)P(A)

其中B代表着证据或是数据,A代表着事件,P(A)称之为先验概率,P(A|B)称之为后验概率。


贝叶斯推理


三门问题 1

问题:
参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车或者是奖品,选中后面有车的那扇门就可以赢得该汽车或奖品,而另外两扇门后面则各藏有一隻山羊。当参赛者选定了一扇门,但未去开启它的时候,知道门后情形的节目主持人会开启剩下两扇门的其中一扇,露出其中一隻山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。问题是:换另一扇门会否增加参赛者赢得汽车的机率?

求证
假设你已经选择了门1
开门前:
设门1,2,3后有车的概率分别为P(1),P(2),P(3)P(1),P(2),P(3)P(1),P(2),P(3),选中车概率为:P(1)=P(2)=P(3)=13P(1)=P(2)=P(3) = {1 \over 3}P(1)=P(2)=P(3)=31,其中的P(n)P(n)P(n)为先验概率
开门后:
P(2∣3)=P(3∣2)P(2)p(3∣2)P(2)+P(3∣1)P(1)++P(3∣3)P(3)P(2|3) = {P(3|2)P(2) \over {p(3|2)P(2)+P(3|1)P(1)++P(3|3)P(3)}}P(23)=p(32)P(2)+P(31)P(1)++P(33)P(3)P(32)P(2)
=1⋅131⋅13+12⋅13+0⋅13= {1 \cdot {1\over 3}\over {1 \cdot {1 \over 3}+{{1 \over 2} \cdot{1 \over 3}}+{0 \cdot {1 \over 3}}}}=131+2131+031131
=23={2 \over 3}=32
P(1∣3)=13P(1|3) = {1 \over 3}P(13)=31
因为P(1∣3)P(13)<P(23),所以选择换门。


贝叶斯推理与机器学习


泰勒展开

任何函数都可以以泰勒展开式拟合。

假设对f(x)f(x)f(x)的拟合函数有如下四个


  • f1(x):Y&#61;W1→拟合得最差f_1(x) :Y &#61; W_1 \to 拟合得最差f1(x):Y&#61;W1
  • f2(x):Y&#61;W1X&#43;B→拟合的极差f_2(x):Y&#61;W_1X&#43;B \to 拟合的极差f2(x):Y&#61;W1X&#43;B
  • f3(x):Y&#61;W1X3&#43;W2X2&#43;W3X1&#43;B拟合的很好f_3(x):Y&#61;W_1X^3&#43;W_2X^2&#43;W_3X^1&#43;B 拟合的很好f3(x):Y&#61;W1X3&#43;W2X2&#43;W3X1&#43;B
  • f4(x):Y&#61;W1X10&#43;W2X9&#43;⋯&#43;W10X1B→完全拟合f_4(x):Y&#61;W_1X^{10}&#43;W_2X^9&#43;\cdots &#43;W_{10}X^1B \to 完全拟合f4(x):Y&#61;W1X10&#43;W2X9&#43;&#43;W10X1B

假设的重要性

过拟合问题
虽然函数f4(x)f_4(x)f4(x)在训练集上完全拟合&#xff0c;Cost&#61;0Cost&#61;0Cost&#61;0,但是在测试集上表现上确有很大的误差&#xff0c;这便是过拟合问题。

泛化误差
上文提到的在测试集上的误差&#xff0c;便是泛化误差。我们求得的最佳拟合函数&#xff0c;应该满足泛化误差最小。

贝叶斯错误率
在求得最小泛化误差的同时&#xff0c;我们需要使拟合函数的训练误差接近贝叶斯错误率。


奥卡姆剃刀2

根据定义&#xff0c;任何假设都会带来犯错误概率的增加&#xff1b;如果一个假设不能增加理论的正确率&#xff0c;那么它的唯一作用就是增加整个理论为错误的概率

在如上的四个拟合函数中&#xff0c;在能解释问题的情况下&#xff0c;我们选择有3个参数的f3(x)f_3(x)f3(x)函数。因为假设越多&#xff0c;参数越多&#xff0c;则这个函数就越脆弱。

修改代价函数
修改前:Cost&#61;1mΣ(Y−Yp)2Cost &#61; {1 \over m}\Sigma(Y-Y_p)^2Cost&#61;m1Σ(YYp)2
修改后:Cost&#61;1mΣ(Y−Yp)2&#43;f(m)Cost &#61;{1 \over m}\Sigma(Y-Y_p)^2 &#43;f(m)Cost&#61;m1Σ(YYp)2&#43;f(m)
举例&#xff1a;Cost&#61;1mΣ(Y−Yp)2&#43;(W12&#43;W22&#43;⋯&#43;Wm2)Cost &#61;{1 \over m}\Sigma(Y-Y_p)^2 &#43;(W_1^2&#43;W_2^2&#43;\cdots &#43;W_m^2)Cost&#61;m1Σ(YYp)2&#43;(W12&#43;W22&#43;&#43;Wm2)
将代价函数增加了一项关于模型的函数&#xff0c;在模型趋向于复杂时&#xff0c;代价函数值也相应增加


决策理论




  1. https://zh.wikipedia.org/zh/蒙提霍爾問題 ↩︎

  2. https://zh.wikipedia.org/zh-hans/奥卡姆剃刀 ↩︎



推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 本文详细解析了JavaScript中相称性推断的知识点,包括严厉相称和宽松相称的区别,以及范例转换的规则。针对不同类型的范例值,如差别范例值、统一类的原始范例值和统一类的复合范例值,都给出了具体的比较方法。对于宽松相称的情况,也解释了原始范例值和对象之间的比较规则。通过本文的学习,读者可以更好地理解JavaScript中相称性推断的概念和应用。 ... [详细]
  • Skywalking系列博客1安装单机版 Skywalking的快速安装方法
    本文介绍了如何快速安装单机版的Skywalking,包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程,将每个考题分配给3个独立的专家,如果他们的评分不一致,则需要请一位裁判做出最终决定。文章详细描述了评分规则,并给出了解决该问题的程序。 ... [详细]
  • 原文地址:https:www.cnblogs.combaoyipSpringBoot_YML.html1.在springboot中,有两种配置文件,一种 ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 本文介绍了绕过WAF的XSS检测机制的方法,包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法,该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型(DOM)接收器和源、实施适当的跨域资源共享(CORS)策略和其他安全策略,可以有效阻止XSS漏洞。但是,WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制,构建与正则表达式不匹配的XSS payload。 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤,并提供了相关的命令和配置示例。 ... [详细]
author-avatar
丫头2502892725
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有