热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

《概率论入门精讲》:深入解析样本空间、概率计算与条件概率概念

《概率论入门精讲》不仅详细介绍了排列组合的基本公式,包括二项式系数、多项式系数以及方程解的个数,还深入探讨了这些公式的应用技巧和问题转化方法。此外,本书对样本空间的概念进行了全面解析,帮助读者理解如何在实际问题中构建和应用样本空间,为进一步学习概率计算与条件概率打下坚实基础。

一、排列组合

基本三个公式:
1、二项式系数
这里写图片描述
2、多项式系数
这里写图片描述
3、方程解的个数
这里写图片描述

这里写图片描述

难度不大,解题中注意问题的转化。


二、样本空间

样本空间:考虑一个实验,所有可能结果构成的子集,称为该实验的样本空间。
这个定义就说明了样本空间的概率是1。

事件:样本空间的任意子集称为事件。

集合运算:
因为事件是集合,所以概率计算中就需要用到集合的各种运算,总结如下:
1、交并补
2、交换律、结合律、分配率。
3、德摩根定律。
这里写图片描述
4、推演出的常用公式:
这里写图片描述
这个公式推广以后就可以说明全概率公式的正确性。

这里写图片描述
可以推广到更多个事件。
上面两个公式很有用,因为求并集的每个事件之间都是互斥的。

互斥事件
两个事件 E F 互斥(不相容),满足EF = 空集。也就是说两个事件不可能同时发生。


三、概率

笼统的讲,有两种概率。第一种是熟知的事件发生的相对频率取极限之后收敛的值。第二种是主观概率,是可信度的度量。

如果用数学语言来定义概率呢?
概率是定义在样本空间中的事件上的集函数,满足三个公理。
1、概率值非负,不大于1。
2、样本空间概率为1。
3、不相容事件并的概率,是每个事件概率的和。

概率的演算公式
1、包含关系
这里写图片描述
看起来简单,证明一下呢?

2、补集
这里写图片描述

3、交集(intersection)
事件交集的概率并不能从事件的概率求出来。除非事件是相互独立的。

4、并集(union)
这里写图片描述
推广一下,就成了容斥公式:
这里写图片描述

5、布尔不等式
这里写图片描述
可以从容斥公式推出。

概率的计算
一般直接计算事件概率的方法(不是从其他事件推理出),是统计事件包括的样本空间结果数量,除以样本空间所有结果的数量。这里有一个假设是,样本空间里每一个结果出现的概率是一样的。很多情况下,即是不说明,这个假设都应该是存在的。

目前,概率的计算就是算出两个排列组合的值,然后相除。后面的很多情况下,新的事件概率是从已知的概率推理出来的,这可以算两个不同的概率计算模式。


四、条件概率

条件概率相关的公式
1、条件概率的定义
这里写图片描述
一个变化的公式也很常用
这里写图片描述

2、乘法规则
这里写图片描述
连续使用条件概率定义的公式,可以证明正确性。

3、贝叶斯公式
这里写图片描述
忘记机器学习里关于贝叶斯公式的东西,从简单的问题来理解贝叶斯公式。

假如有n个事件,每个事件记为Fj,这些事件的概率都已知。也就是P(Fj),这个被称为先验概率(就是最初的概率嘛)。
这种情况下,突然发生了一个事件E,此时要求E为条件的情况下Fj的概率,也就是后验概率。

考虑Fj是n个对同一个问题的不同假设(比如某人是否是癌症病人),每种假设有一个先验概率。当观察到一个事件E时,E能够对不同假设产生不同效果(比如肺部有一大片阴影这个事件会提高病人得了癌症的概率)。所以E也叫做证据。根据证据我们就可以修正原来假设的概率,修正后的概率就是后验概率。

简单说,贝叶斯公式是根据观察到的证据修正假设的概率的方法。

举个例子说明概率修正的意思。你去买彩票,中头奖的概率是已知的吧。开奖那天你无意中知道除了最后一个数字外,你买的彩票和头奖的开奖结果一模一样。这时,你对中头奖的预期就被大大提高了。这就是已知的证据修正了你对是否中头奖这个问题的假设的概率。

4、优势比
事件A发生的概率和A不发生的概率的比值是事件A的优势比。
这里写图片描述

这里写图片描述
这个公式可以认为是证据修正事件优势比的公式。由贝叶斯公式推出。

5、全概率公式
这里写图片描述
其中Fi两两之间是不相容的。这就是贝叶斯公式等号右边的分母的部分。

独立事件
从上面贝叶斯公式的讨论中知道,证据事件E会修正已有事件F的概率,也就是说P(F | E)一般不等于P( F )。如果E不能对F产生影响的话,那么就认为E,F两个事件是独立的。有公式:

P( F | E ) = P( F )

换种表达:
这里写图片描述

如果三个事件之间互相独立,有:
这里写图片描述

独立性推广到任意个事件之间:
这里写图片描述

概率独立性重要的原因在于很多的试验由一连串的重复试验组成的,试验之间彼此相同且相互独立的,也就是独立同分布。独立事件的定义保证了在计算一个独立同分布的重复试验的结果时,可以由每个事件的概率的乘积得到。

条件概率满足概率的所有定义
条件概率的定义满足概率的三个公理,在给定条件的情况下,事件的条件概率就是一个概率。

有点废话的感觉,换作用公式表示:P(F | E) = Q( F )。就是说E为条件下F的概率可以看做另一个F的概率函数。这个函数Q满足概率的所有定义和演算公式。所以条件概率上也可以使用上述的概率演算公式。上述概率演算公式中,每一个概率表达式中,都添加一个相同的条件,就得到条件概率的演算公式了。

条件独立(条件概率的独立)
既然条件概率是一个概率了,当然也可以计算条件概率和拥有独立性。思路类似:
这里写图片描述
如果把条件F去掉,就成了普通的独立事件公式了。

另外验证条件概率的条件概率:
P( E1 | E2F ) = P( E1E2 | F ) / P( E2 | F )
看,如果把F条件去掉,是不是就成了普通的条件概率的公式。以上两个结论都证明了条件概率满足概率的所有定义这个事实。


五、难点

1、事件的互斥性和独立性。
关于两个事件的以下结论成立:
互不相容一定不独立
独立一定相容

PS:一个没想通的问题
命题:若P( A | B ) = 1,则B 属于A。该命题成立吗?如果不成立,正确的推论应该是什么呢?


推荐阅读
  • 在该项目中,参与者需结合历史使用模式和天气数据,以预测华盛顿特区自行车共享系统的租赁需求。数据分析部分首先涉及数据的收集,包括用户骑行记录和气象信息,为后续模型构建提供基础。通过深入的数据预处理和特征工程,确保数据质量和模型准确性,最终实现对自行车租赁需求的有效预测。 ... [详细]
  • 理工科男女不容错过的神奇资源网站
    十一长假即将结束,你的假期学习计划进展如何?无论你是在家中、思念家乡,还是身处异国他乡,理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档,能够帮助你在假期中高效学习和提升专业技能。 ... [详细]
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • 表面缺陷检测数据集综述及GitHub开源项目推荐
    本文综述了表面缺陷检测领域的数据集,并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理,为研究人员提供了全面的资源参考,有助于推动该领域的发展和技术进步。 ... [详细]
  • 在第七天的深度学习课程中,我们将重点探讨DGL框架的高级应用,特别是在官方文档指导下进行数据集的下载与预处理。通过详细的步骤说明和实用技巧,帮助读者高效地构建和优化图神经网络的数据管道。此外,我们还将介绍如何利用DGL提供的模块化工具,实现数据的快速加载和预处理,以提升模型训练的效率和准确性。 ... [详细]
  • 如何提升Python处理约1GB数据集时的运行效率?
    如何提升Python处理约1GB数据集时的运行效率?本文探讨了在后端开发中使用Python处理大规模数据集的优化方法。通过分析常见的性能瓶颈,介绍了多种提高数据处理速度的技术,包括使用高效的数据结构、并行计算、内存管理和代码优化策略。此外,文章还提供了在Ubuntu环境下配置和测试这些优化方案的具体步骤,适用于从事推荐系统等领域的开发者。 ... [详细]
  • 利用Java开发百度图片爬虫,实现高效下载功能
    为了满足大量图像素材的需求以支持机器学习项目,本文介绍了一种基于Java语言开发的百度图片爬虫工具,该工具能够高效地抓取并下载百度图片中的资源。文章首先展示了爬虫运行的效果图,并详细阐述了其工作原理和技术实现路径,重点解析了如何通过分析百度图片的网页结构来实现精准抓取。此外,还讨论了在实际应用中可能遇到的问题及解决方案。 ... [详细]
  • 在本文中,我们将深入探讨斯坦福大学机器学习课程第二部分的核心内容与学习体会。文章不仅涵盖了正则化(Regularization)等关键概念,还结合实际案例分析了这些理论在实践中的应用,帮助读者更好地理解和掌握机器学习的高级技巧。此外,我们还将分享一些学习过程中遇到的挑战及解决方案,为后续学习者提供参考。 ... [详细]
  • 深入解析 OpenCV 2 中 Mat 对象的类型、深度与步长属性
    在OpenCV 2中,`Mat`类作为核心组件,对于图像处理至关重要。本文将深入探讨`Mat`对象的类型、深度与步长属性,这些属性是理解和优化图像操作的基础。通过具体示例,我们将展示如何利用这些属性实现高效的图像缩小功能。此外,还将讨论这些属性在实际应用中的重要性和常见误区,帮助读者更好地掌握`Mat`类的使用方法。 ... [详细]
  • 本文介绍了Android动画的基本概念及其主要类型。Android动画主要包括三种形式:视图动画(也称为补间动画或Tween动画),主要通过改变视图的属性来实现动态效果;帧动画,通过顺序播放一系列预定义的图像来模拟动画效果;以及属性动画,通过对对象的属性进行平滑过渡来创建更加复杂的动画效果。每种类型的动画都有其独特的应用场景和实现方式,开发者可以根据具体需求选择合适的动画类型。 ... [详细]
  • 深入解析经典卷积神经网络及其实现代码
    深入解析经典卷积神经网络及其实现代码 ... [详细]
  • [TyvjP1050] 动态规划求解最长公共子序列问题
    在解决最长公共子序列问题时,动态规划是一种高效的方法。具体而言,我们使用二维数组 `dp[i][j]` 来表示第一个字符串匹配到第 `i` 位,第二个字符串匹配到第 `j` 位时的最长公共子序列长度。状态转移方程为:当两个字符相等时,`dp[i][j] = dp[i-1][j-1] + 1`;否则,`dp[i][j] = max(dp[i-1][j], dp[i][j-1])`。通过这种方法,我们可以有效地计算出两个字符串的最长公共子序列。 ... [详细]
  • 状态模式在软件设计中的应用与实现
    本文以酒店管理系统为例,探讨了状态模式在软件设计中的应用与实现。酒店房间的状态包括空闲、已预订和已入住,这些状态之间可以相互转换。通过引入状态模式,系统能够更加灵活地管理和响应不同状态下的操作,提高了代码的可维护性和扩展性。此外,状态模式还简化了状态转换的逻辑处理,使得系统的整体架构更为清晰和高效。 ... [详细]
  • 在斯坦福大学的公开课中,详细探讨了多变量线性回归在机器学习中的应用与解析。课程内容涵盖了多维特征的处理方法,以及如何通过多变量梯度下降算法优化模型参数,为理解和实现复杂的回归问题提供了坚实的理论基础和实践指导。 ... [详细]
  • Linux驱动更新管理器:领先技术革新,甚至Windows 10也在参考其先进功能
    Linux驱动更新管理器在操作系统驱动维护方面展现了卓越的技术优势,其高效、可靠的更新机制赢得了广泛认可。许多用户和专家建议,微软应考虑在其Windows 10系统中借鉴这一先进功能,以提升系统的稳定性和用户体验。 ... [详细]
author-avatar
育诚家瑋逸群
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有