常见的概率论问题清单及其答案

作者：逗壳 | 来源：互联网 | 2023-09-23 03:51

概率论与信息论基础1、比较“频率论概率”和“贝叶斯概率”？频率学派对概率的定义包含两个要点：（1）：事件A

概率论与信息论基础

1、比较“频率论概率”和“贝叶斯概率”&＃xff1f;

频率学派对概率的定义包含两个要点&＃xff1a;
&＃xff08;1&＃xff09;&＃xff1a;事件A发生的概率是一个常数&＃xff0c;也就是说频率学派认为事件发生的概率是一个确定的数&＃xff0c;可以直接求出来。
&＃xff08;2&＃xff09;&＃xff1a;事件A发生的概率是通过重复多次进行同一实验得到的。当重复实验的次数趋于无穷&＃xff0c;事件的频率趋于事件A发生的概率。

贝叶斯学派对概率的定义包括以下三个要点&＃xff1a;
&＃xff08;1&＃xff09;&＃xff1a;事件A发生的概率是变化的&＃xff0c;并非常数&＃xff0c;也就是说事件发生的概率具有不确定性。
&＃xff08;2&＃xff09;&＃xff1a;事件A发生的概率是在特定条件下的条件概率。
&＃xff08;3&＃xff09;&＃xff1a;事件A发生的概率是一个后验概率&＃xff0c;且事件发生的先验概率已知。

频率学派认为&＃xff1a;概率及其模型(参数)是真实确定存在的&＃xff0c;而事件本身是随机的&＃xff1b;因此&＃xff0c;可以通过最大似然估计参数的值。比如&＃xff0c;在随机试验过程中&＃xff0c;我们把某事件发生的比例或频率作为该事件发生的概率。
贝叶斯学派则持完全不同的观点&＃xff0c;他们认为&＃xff1a;真实出现的事件是一种确定性的存在&＃xff0c;而模型及其参数反而是不确定的随机变量。在分析过程中&＃xff0c;总是先假设一个先验的概率分布&＃xff0c;随着样本的增加&＃xff0c;不断的修正先验的概率分布。

2、什么是随机变量&＃xff1f;

随机变量X是定义在样本空间的S上的实值单值函数。也就是说它是随机试验结果的函数。
它的取值随试验的结果而定&＃xff0c;是不能预先确定的&＃xff0c;它的取值具有一定的概率。
作用是&＃xff1a;随机变量的引入&＃xff0c;使概率论的研究由个别随机事件扩大为随机变量所表征的随机现象的研究。

3、什么是概率分布&＃xff1f;

概率分布就是描述随机变量落在某个区间的概率&＃xff0c;描述了随机变量的统计规律性。

4、概率质量函数和概率密度函数&＃xff1f;

它们本质是相同的&＃xff0c;只是表现的形式不同&＃xff0c;
描述离散型数据的概率分布的叫概率质量函数&＃xff1b;描述连续型数据叫做概率密度函数。
概率质量(mass)函数&＃xff1a;各个分类的概率。
概率密度(density)函数&＃xff1a;数据落在某一段连续的区间的概率。

然后为何一个叫做质量&＃xff0c;一个叫做密度。主要是他们从英文翻译过来的。所以得从英文解释。
概率质量函数&＃xff1a;
mass强调的是一个聚集在一起的物体&＃xff0c;就是它一个块一块的。这和离散型数据很像&＃xff0c;就是一堆数据属于某个类。他们是聚集一块一块的。所以用mass这个词来描述他们的概率。翻译成中文就变成了概率质量函数。你可以这么记忆&＃xff1a;离散型数据是块状物体&＃xff0c;物体是有质量&＃xff0c;所以叫做概率质量函数。

概率密度函数(Probability Density Function&＃xff09;
这个是描述连续性数据。就是落在某个区间内的概率多大。这个就像液体&＃xff0c;液体是连续的。同等体积有些液体重有些液体轻&＃xff0c;用密度这个词描述会更合适。它的缩写很意思&＃xff0c;叫做PDF&＃xff0c;哈哈哈。

5、函数成为概率密度函数的条件

非负&＃xff0c;积分和为1

6、条件概率的链式法则

根据条件概率的定义&＃xff1a;p(A,B) &＃61; p(A|B)p(B)
推广到一般情况下就是条件概率的链式法则&＃xff1a;
p(X1,X2,…,Xn) &＃61; p(X1|X2,…,Xn)*p(X2|X3,…,Xn)…p(Xn-1|Xn)p(Xn)

7、两个随机变量的独立性和条件独立性&＃xff1f;

独立性&＃xff1a;P(A,B) &＃61; P(A)P(B) 也就是说两个随机试验发生的结果相互没有干扰。
条件独立性&＃xff1a;P(A,B|C&＃xff09; &＃61; P(A|C)P(B|C)

8、大数定律

极限定理是概率论的基本理论&＃xff0c;大数定律和中心极限定理是其中最重要的两个定理。

大数定律;叙述的是随机变量序列的前一些项的算数平均值在某种条件下收敛到这些项的均值的算数平均值。
在这里插入图片描述
通俗的说&＃xff0c;辛钦大数定律是说&＃xff0c;独立同分布且具有均值u的随机变量X1,…,Xn&＃xff0c;当n很大的时候&＃xff0c;他们的算数平均有很大可能接近u。

在这里插入图片描述
伯努利大数定律表明&＃xff0c;当独立重复实验的次数趋于无穷的时候&＃xff0c;事件A发生的频率接近于事件A发生的概率。这也是频率具有稳定的真正含义&＃xff0c;也是为什么实际应用过程中&＃xff0c;当实验次数很大&＃xff0c;便可以用事件的频率代替事件的概率的理由。

9、中心极限定理

中心极限定理叙述的是&＃xff0c;在什么条件下&＃xff0c;大量随机变量和的分布逼近于正态分布。
客观背景&＃xff1a;在客观实际中许多随机变量&＃xff0c;它们是由大量的相互独立的随机因素的综合影响所形成的&＃xff0c;而其中每一个因素在总的影响中所起到的作用是微小的&＃xff0c;这种随机变量往往近似服从正态分布。
在这里插入图片描述
这里规定&＃xff0c;随机变量之间的独立同分布的&＃xff0c;实际上&＃xff0c;李雅普诺夫定理表明&＃xff0c;不是同分布&＃xff0c;无论随机变量服从什么分布&＃xff0c;在某种条件下&＃xff0c;他们和的分布也逼近于正态分布。

10、介绍假设检验&＃xff1f;以及它的应用

假设检验和参数估计是统计推断中两类重要问题。假设检验是在总体的分布函数完全未知或者只知其形式&＃xff0c;参数未知的情况下。为了推断总体的某些特征&＃xff0c;根据经验或者样本的提出一些关于总体的假设&＃xff0c;再根据样本对所提出假设做出接受或者是拒绝的决策过程。

其中蕴含了两个重要的思想&＃xff0c;小概率事件原理和反证法。

应用&＃xff1a;质量检测&＃xff0c;产品检测等&＃xff0c;一般情况下&＃xff0c;就是我们需要对某个对象的总体的一些特征做出一些判断&＃xff0c;而我们又无法得到总体全部的数据或者得到总体全部的数据代价很大的时候&＃xff0c;那么我们就可以根据实际问题或者以往的经验对总体做出一些假设&＃xff0c;在通过抽样得到总体的部分样本去检验我们的假设是否正确。

11、卡方检验

说到卡方检验&＃xff0c;就必须先说说抽样分布的三大分布之一的卡方分布&＃xff0c;
在这里插入图片描述
性质&＃xff1a;

**卡方检验是在零假设近似成立时&＃xff0c;检验统计量的分布服从卡方分布的假设检验。在在没有其他的限定条件或说明时&＃xff0c;卡方检验一般指代的是皮尔森卡方检验。
卡方检验可以用来检验单个正态总体均值未知&＃xff0c;方差是否等于某个值。

皮尔逊卡方检验
皮尔逊卡方检验经常用来根据样本数据推断总体分布与期望分布是否有显著差异&＃xff0c;或推断分类变量间是否相互关联或彼此独立
变量独立性检验步骤&＃xff0c;一般是通过列联表来求解。
在这里插入图片描述

12、皮尔逊相关系数和卡方检验的区别

皮尔逊相关系数&＃xff1a;定义了两个随机变量的协方差与标准差的商
在这里插入图片描述
相关系数在0到1之间&＃xff0c;相关系数越大&＃xff0c;两者相关性越大
卡方检验是统计实际观察值和理论推断值之间的偏离程度&＃xff0c;卡方值越大&＃xff0c;两者的偏离程度越大。

13、t检验

零假设成立时&＃xff0c;检验统计量服从t分布的假设检验。

t分布
在这里插入图片描述
t检验常用来检验正态总体方差未知&＃xff0c;检验总体的均值。
在多元线性回归中t检验用来检验各个回归系数的显著性。

14、F检验

零假设成立时&＃xff0c;检验统计量服从F分布的假设检验

F分布
在这里插入图片描述
两个正态总体均值未知&＃xff0c;检验两者方差之间的关系&＃xff0c;用到F检验。
在多元线性回归中&＃xff0c;F检验通常用来检验整个回归关系的显著性

15、P值的含义&＃xff1f;

p值就是在原假设可拒绝的最小显著性水平&＃xff0c;当我们根据样本观察值计算出p值&＃xff0c;如果它比我们预先设定的显著性水平小&＃xff0c;那么说明观察值落入拒绝域内&＃xff0c;若比显著性水平大&＃xff0c;那么样本观察值落在拒绝域外&＃xff0c;接受原假设。

说白了就是P值就是当原假设为真时&＃xff0c;根据样本观察结果计算的检验统计量落入拒绝域的概率。如果P值很小&＃xff0c;说明这种情况的发生的概率很小&＃xff0c;而如果出现了&＃xff0c;根据小概率原理&＃xff0c;我们就有理由拒绝原假设&＃xff0c;P值越小&＃xff0c;我们拒绝原假设的理由越充分。

function
pdf

推荐阅读

version
MATLAB字典学习工具箱SPAMS：稀疏与字典学习的详细介绍、配置及应用实例

SPAMS（Sparse Modeling Software）是一个强大的开源优化工具箱，专为解决多种稀疏估计问题而设计。该工具箱基于MATLAB，提供了丰富的算法和函数，适用于字典学习、信号处理和机器学习等领域。本文将详细介绍SPAMS的配置方法、核心功能及其在实际应用中的典型案例，帮助用户更好地理解和使用这一工具箱。 ... [详细]

蜡笔小新 2024-11-09 16:17:27
select
h5调用本地摄像头和麦克风一

h5调用本地摄像头和麦克风一,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2024-11-15 05:01:35
list
解决Parallels Desktop错误15265的方法

本文详细介绍了在使用Parallels Desktop时遇到错误15265的多种解决方案，包括检查网络连接、关闭代理服务器和修改主机文件等步骤。 ... [详细]

蜡笔小新 2024-11-12 05:14:12
text
百度飞桨图像分割课程笔记14：全景分割技术详解——PanopticDeepLab（CVPR 2019）

Panoptic-DeepLab 是一种自底向上的全景分割方法，无需预先进行目标检测。该模型在 CVPR 2019 上提出，以其简洁、强大且快速的特点成为全景分割任务的基准。通过高效地结合实例分割和语义分割，Panoptic-DeepLab 能够准确地识别和区分图像中的每个对象和背景区域，为复杂的场景提供全面的分割结果。 ... [详细]

蜡笔小新 2024-11-11 09:11:39
text
B站服务器故障影响豆瓣评分？别担心，阿里巴巴架构师分享预防策略与技术方案

13日晚上，在视频观看高峰时段，B站出现了服务器故障，引发网友在各大平台上的广泛吐槽。这一事件导致了连锁反应，大量用户纷纷涌入A站、豆瓣和晋江等平台，给这些网站带来了突如其来的流量压力。为了防止类似问题的发生，阿里巴巴架构师分享了一系列预防策略和技术方案，包括负载均衡、弹性伸缩和容灾备份等措施，以确保系统的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-11-10 15:59:22
sum
NFT市场热度持续攀升，波卡能否抓住机遇迎来NFT夏季热潮？

NFT市场热度持续攀升，波卡能否抓住机遇迎来NFT夏季热潮？ ... [详细]

蜡笔小新 2024-11-09 21:54:31
sum
如何将PD文件转换为Word文档？PD格式的设置技巧与方法

如何将PD文件转换为Word文档？PD格式的设置技巧与方法 ... [详细]

蜡笔小新 2024-11-09 20:31:53
hash
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
hash
如何在PDF文档中添加新的文本内容？

在处理PDF文件时，有时需要向其中添加新的文本内容。这是否可以直接实现呢？有哪些简便且免费的方法可供选择？使用极速PDF阅读器打开文档后，可以通过点击左上角的“注释”按钮切换到注释模式，并选择相应的工具进行编辑。此外，还可以利用其他功能丰富的PDF编辑软件，如Adobe Acrobat DC或Foxit PhantomPDF，它们提供了更多高级的编辑选项，能够满足更复杂的需求。 ... [详细]

蜡笔小新 2024-11-09 14:15:18
hash
【PDF资源】大数据峰会：阿里巴巴在大规模流式增量计算中的应用与实践

布民于2015年加入阿里巴巴，目前担任阿里云高级专家和技术委员会成员，负责大规模流计算与图计算平台。他在微软亚洲研究院期间担任主管研究员，专注于大规模分布式计算的研究。本文将详细介绍阿里巴巴在大规模流式增量计算中的应用与实践，分享其在实时数据处理和分析方面的最新进展和技术挑战。 ... [详细]

蜡笔小新 2024-11-08 18:31:57
version
解决针织难题：R语言编程技巧与常见错误分析

解决针织难题：R语言编程技巧与常见错误分析 ... [详细]

蜡笔小新 2024-11-08 15:02:19
version
探究 Lua 在 .NET 生态系统中的应用与挑战：鲜为人知的研究领域

在当前的软件开发领域，Lua 作为一种轻量级脚本语言，在 .NET 生态系统中的应用逐渐受到关注。本文探讨了 Lua 在 .NET 环境下的集成方法及其面临的挑战，包括性能优化、互操作性和生态支持等方面。尽管存在一定的技术障碍，但通过不断的学习和实践，开发者能够克服这些困难，拓展 Lua 在 .NET 中的应用场景。 ... [详细]

蜡笔小新 2024-11-08 14:47:43
version
精选Linux经典著作在数字图书馆展出

数字图书馆近期展出了一批精选的Linux经典著作，这些书籍虽然部分较为陈旧，但依然具有重要的参考价值。如需转载相关内容，请务必注明来源：小文论坛（http://www.xiaowenbbs.com）。 ... [详细]

蜡笔小新 2024-11-08 10:55:29
version
神经元研究动态：城市大脑标准化体系及评估指标综合框架分析

神经元研究动态：城市大脑标准化体系及评估指标综合框架分析 ... [详细]

蜡笔小新 2024-11-07 15:56:03
version
如何在ASP.NET中通过加密数据库连接字符串来增强数据安全性

本文详细探讨了在ASP.NET环境中通过加密数据库连接字符串来提升数据安全性的方法。加密技术不仅能够有效防止敏感信息泄露，还能增强应用程序的整体安全性。文中介绍了多种加密手段及其实施步骤，帮助开发者在日常开发过程中更好地保护数据库连接信息，确保数据传输的安全可靠。 ... [详细]

蜡笔小新 2024-11-07 12:20:22

逗壳

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章