当前位置: 开发笔记 > 程序员 > 正文

概率论的学习和整理11：伯努利试验的3种分布：01分支，几何分布，二项分布

作者：为什么不嫩注册 | 来源：互联网 | 2023-10-11 11:03

1伯努利试验1.1什么是伯努利试验伯努利试验伯努利试验是一个有两种结果的简单试验，它的结果是成功或失败，黑或白，开或关，

1 伯努利试验

1.1 什么是伯努利试验

伯努利试验

伯努利试验是一个有两种结果的简单试验&＃xff0c;它的结果是成功或失败&＃xff0c;黑或白&＃xff0c;开或关&＃xff0c;没有中间的立场。
每次试验的结果只有两个&＃xff1a;事件发生或不发生&＃xff0c;或多种结果归纳为高度抽象为两种

伯努利概型是一种基于独立重复试验的概率模型&＃xff0c;它的基本特征&＃xff1a;

在一组固定不变的条件下重复地做一种试验。
每次试验的结果只有两个&＃xff1a;事件发生或不发生&＃xff0c;或多种结果归纳为高度抽象为两种
每次试验中&＃xff0c;相同事件发生的概率均一样。(试验样本总数和概率不能变)
各次重复试验的结果是相互独立&＃xff0c;互不影响的。
1重伯努利试验就是 0-1分布
n 重伯努利试验就是二项分布 p&＃61;C(n,k)*p^k*(1-p)^n-k

N重伯努利试验和二项分布
优势

不要求具体的样本总量的具体数量
只需要知道概率就行&＃xff0c;但要求概率是稳定不变的&＃xff08;多次伯努利试验时&＃xff09;
还需要知道抽样试验的次数&＃xff0c;目标事件的次数

局限性

能不能用二项分布先判断&＃xff0c;是不是符合N重伯努利试验&＃xff0c;如果不符合就没戏
二项分布&＃xff0c;伯努利试验&＃xff0c;需要保证样本容量确定&＃xff0c;且分布也要稳定&＃xff0c;否则不能
必须是放回抽样
如果是不放回抽样&＃xff0c;

要么认为样本极其大&＃xff0c;忽略样本总量变化&＃xff0c;概率变化不稳定的影响
要么得用超几何分布

使用时注意点

需要严格认识的地方&＃xff1a;
N次试验&＃xff0c;每次试验都稳定&＃xff0c;样本总数和概率都稳定才能视为N重伯努利试验&＃xff0c;才能用二项分布
不放回抽样&＃xff0c;一般不适合二项分布
因为小样本量前提下&＃xff0c;不放回抽样会破坏第一次试验后的样本空间数和概率&＃xff0c;发生变化&＃xff01;第2次试验无法和第1次相同了
如果样本量足够大&＃xff0c;即使是不放会抽样&＃xff0c;可以用二项分布近似

1.2 伯努利试验相关的3种分布

0-1分布
只进行1次伯努利试验的随机变量&＃xff0c;符合0-1分布&＃xff0c;f(x&＃61;k)&＃61;p^k*(1-p)^(1-k)
k&＃61;{0,1}

几何分布&＃xff1a;
进行n次伯努利试验&＃xff0c;只有最后1次成功&＃xff0c;成功次数第N次,N符合几何分布
f(x&＃61;k)&＃61;p*(1-p)^(k-1)
其中 k 是总试验次数&＃xff0c;一共进行了k次&＃xff0c;且第k次&＃xff08;也就是最后1次&＃xff09;成功

二项分布&＃xff1a;
进行N次伯努利试验&＃xff0c;有k次成功&＃xff0c;成功次数k符合二项分布
f(x&＃61;k)&＃61;C(n,k)*p^k*(1-p)^(n-k)
其中n是总试验次数&＃xff0c;k是成功次数&＃xff08;对应成功的概率p&＃xff09;

2 关于0-1分布 (也称为伯努利分布 \ ab分布 \ 两点分布等)

2.1 0-1分布的基本概率和公式

0-1分布&＃xff1a;只进行1次伯努利试验的随机变量&＃xff0c;结果只有2种&＃xff0c;符合0-1分布

一个随机事件&＃xff0c;发生记为k&＃61;1&＃xff0c;不发生记为k&＃61;0&＃xff0c;若事件服从0-1分布&＃xff0c;

则k的分布律为&＃xff1a;
k 0 1
p(k) 1-p p

0-1分布的概率公式 f(x)&＃61;p^k*(1-p)^(1-k)
k&＃61;{0,1}
其实就是

k&＃61;1时&＃xff0c;f(x)&＃61;p
k&＃61;0时&＃xff0c;f(x)&＃61;1-p

2.2 0-1分布的概率分布图&＃xff0c;pdf 和 cdf

0-1分布&＃xff0c;因为只有1次试验
只有两种结果
所以分布图看起来就是这种直线。。。。

	k	p1	p2	p3	p4	p5
pdf	0	0.9	0.8	0.5	0.2	0.1
	1	0.1	0.2	0.5	0.8	0.9
cdf	0	0.9	0.8	0.5	0.2	0.1
	1	1	1	1	1	1

2.3 0-1分布的期望和方差

E(X) &＃61; 0*(1-p)&＃43;1*p &＃61; p
D(X) &＃61; p*(1-P)
缺少证明过程

3 几何分布

3.1 什么是几何分布

几何分布就是一种定义为&＃xff1a;在n次伯努利试验中&＃xff0c;试验k次才得到第一次成功的机率。

详细地说是&＃xff1a;前k-1次皆失败&＃xff0c;第k次成功的概率。

首先几何分布&＃xff0c;属于古典概型/ 伯努利试验
特点是&＃xff1a;只有每次试验只可能有两种结果
如果只做1次试验&＃xff0c;那是属于0-1分布&＃xff0c;但是如果做N次试验&＃xff0c;但是只有最后一次成功&＃xff0c;则随机变量符合几何分布&＃xff0c;但是如果做N次试验&＃xff0c;没其他限制&＃xff0c;则随机变量符合二项分布
由上可知&＃xff0c;0-1分布&＃xff0c;几何分布&＃xff0c;应该都可以归纳为&＃xff0c;二项分布的一种特例。

4 二项分布

4.1 什么是二项分布和N重伯努利试验

在概率论和统计学中&＃xff0c;二项分布是n个独立的成功/失败试验中成功的次数的离散概率分布&＃xff0c;
其中每次试验的成功概率为p。
其实&＃xff0c;只有符合N重伯努利试验的随机变量&＃xff0c;才可能服从二项分布&＃xff01;

二项分布包含0-1分布和几何分布
当n&＃61;1时&＃xff0c;二项分布就是伯努利分布&＃xff0c;也就是0-1分布&＃xff0c;如果只有最后一次成功又是几何分布。

4.2 二项分布的公式

一般地&＃xff0c;如果随机变量服从参数为和的二项分布&＃xff0c;我们记为或。n次试验中正好得到k次成功的概率由概率质量函数给出&＃xff1a;
p(x&＃61;k)&＃61;C(n,k)*p^k*(1-p)^(n-k)
其中n是总试验次数&＃xff0c;k是成功次数&＃xff08;对应成功的概率p&＃xff09;
式中k&＃61;0&＃xff0c;1&＃xff0c;2&＃xff0c;…
而C(n,k)&＃61; n!/(n-k)!*k! 是二项式系数,&＃xff08;这就是二项分布名称的由来&＃xff09;

该公式可以用以下方法理解&＃xff1a;我们希望有k次成功(p)和n−k次失败(1 −p)。
并且&＃xff0c;k次成功可以在n次试验的任何地方出现&＃xff0c;而把k次成功分布在n次试验中共有个C(n,k)不同的方法。

4.3 二项分布的两个概率的概念理解

二项分布&＃xff0c;指的是N次试验里成功k次的概率符合二项分布
而内部的单次试验&＃xff0c;是伯努利试验&＃xff0c;其单次试验的概率p&＃xff0c;是稳定不变的。

N 次试验里成功k次的概率的 k~~p(k) 情况
p(k) 是表示多次试验&＃xff0c;且要求&＃xff08;n次出k次成功&＃xff09;的概率
p(k) 和单次试验的概率P不要混淆

4.4 二项分布概率分布函数

4.4.1 二项分布的pdf 和cdf 如图

二项分布的pdf
二项分布的cdf

4.4.2 二项分布的pdf 的变化

先看下整体图

纵向是&＃xff0c;单次伯努利试验的p提升
横向是&＃xff0c;试验次数n的增加
内部里面是&＃xff0c;坐标系的横轴是 n次试验成功次数k&＃xff0c;k的概率变化

纵向看

在总试验次数不变的前提下&＃xff0c;随着单次伯努利试验里&＃xff0c;概率p的增加
整个二项分布的波峰逐渐右移&＃xff0c;意味着&＃xff0c;波峰是概率最高的次数逐渐变大&＃xff08;概率越大&＃xff0c;n次试验内成功k次&＃xff0c;k也会越大&＃xff0c;符合直觉&＃xff09;
概率很小的时候&＃xff0c;可能只成功0次&＃xff0c;1次的概率很大&＃xff0c;
概率很大的时候&＃xff0c;试验n次,k次成功的k越来越大&＃xff0c;甚至接近n了

横向看

在单次伯努利试验里&＃xff0c;概率p不变的前提下&＃xff0c;随着试验次数的增多
整个二项分布的波峰逐渐右移&＃xff0c;意味着&＃xff0c;波峰是概率最高的次数逐渐变大&＃xff08;概率不变&＃xff0c;n次试验内成功k次&＃xff0c;试验次数n越多&＃xff0c;k也会越大&＃xff0c;符合直觉&＃xff09;
但是概率不变前提下&＃xff0c; 虽然成功的次数k变多了&＃xff0c;但比例并不变&＃xff08;因为基础的单次伯努利试验的概率没变&＃xff0c;这是横向变化的前提&＃xff09;

4.5 二项分布的期望和方差

二项分布的期望
E(X)&＃61;n*p
二项分布的方差
D(X)&＃61;n*p*(1-P)

缺乏推导过程

4.6 二项分布的一个例题

如果像利用二项分布&＃xff0c;需要灵活的去划分样本空间为2种结果&＃xff0c;比如例题中的
这样划分2种&＃xff1a;这次抽样后需要调整机器 &＃61;&＃61; 对应的变量是本次检验&＃xff0c;次品数量>1

今天某次检查次品数>1&＃61;&＃61;今天需要调整机器 / 对立今天不调整机器
每天检查4次&＃xff0c;相当于做了4次伯努利试验
方法1&＃xff0c;完全用了二项分布思路和解法
方法2&＃xff0c;用了古典概型的&＃xff0c;每次试验都是独立的&＃xff0c;和加法原理加起来算的

注意&＃xff0c;为了达到目标事件&＃xff0c;事件可能需要几次户型转化&＃xff0c;随机变量可能要转化几次

推荐阅读

pdf
利用 Calcurse 在 Linux 终端高效管理日程与任务

对于喜爱使用 Linux 终端进行日常操作的系统管理员来说，Calcurse 提供了一种强大的方式来管理日程安排、待办事项及会议。本文将详细介绍如何在 Linux 上安装和使用 Calcurse，帮助用户更有效地组织工作。 ... [详细]

蜡笔小新 2024-11-21 17:01:54
图片
图像处理学习笔记：噪声分析与去除策略

本文详细探讨了不同类型的图像噪声及其对应的降噪技术，旨在帮助读者理解各种噪声的本质，并掌握有效的降噪方法。文章不仅介绍了高斯噪声、瑞利噪声、伽马噪声、指数噪声、均匀噪声和椒盐噪声等常见噪声类型，还特别讨论了周期噪声的特性及处理技巧。 ... [详细]

蜡笔小新 2024-11-21 12:22:40
图片
2019-2020学年 20174325 叶竞蔚《网络对抗技术》实验六：Metasploit基础应用

本实验旨在掌握Metasploit框架的基本应用方法，重点学习三种常见的攻击方式及其实施思路。实验内容包括一次主动攻击（如MS08-067）、一次针对浏览器的攻击（如MS11-050）以及一次针对客户端的攻击（如Adobe漏洞利用）。此外，还包括成功应用一个辅助模块。 ... [详细]

蜡笔小新 2024-11-17 17:21:38
图片
python发送邮件库_drymail：Python 电子邮件发送库

说明Python教程正在编写中，欢迎大家加微信sinbam提供意见、建议、纠错、催更。drymail是一个邮件发送库，封装了Python的smtplib ... [详细]

蜡笔小新 2024-11-16 09:30:20
图片
FreeRTOS 第九课：任务通知机制

任务通知是 FreeRTOS 中的一个可选功能，需要通过配置宏 `#define configUSE_TASK_NOTIFICATIONS 1` 来启用。每个任务控制块 (TCB) 都包含一个32位的通知值，用于任务间的同步和通信。 ... [详细]

蜡笔小新 2024-11-15 16:39:39
图片
解决Win7安装SQL Server时NetFx3启动失败的问题

在使用Win7系统安装SQL Server时，部分用户可能会遇到“启动Windows功能NetFx3时出错”的提示。本文将详细介绍这一问题的原因及解决方法。 ... [详细]

蜡笔小新 2024-11-15 14:37:26
区块链
Sia (Siacoin/SC/云储币) 去中心化存储平台资源汇总

本文整理了关于Sia去中心化存储平台的重要网址和资源，旨在为研究者和用户提供全面的信息支持。 ... [详细]

蜡笔小新 2024-11-15 13:29:59
cpu
面试题总结_2019年全网最热门的123个Java并发面试题总结

面试题总结_2019年全网最热门的123个Java并发面试题总结 ... [详细]

蜡笔小新 2024-11-15 11:58:13
cpu
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
cpu
操作系统如何通过进程控制块管理进程

本文详细介绍了操作系统如何通过进程控制块（PCB）来管理和控制进程。PCB是操作系统感知进程存在的重要数据结构，包含了进程的标识符、状态、资源清单等关键信息。 ... [详细]

蜡笔小新 2024-11-13 16:14:39
cpu
使用Java和PDFBox实现PDF局部切割

本文介绍了如何使用Java和PDFBox库根据坐标值对PDF文件进行局部切割的方法。 ... [详细]

蜡笔小新 2024-11-13 13:04:52
架构
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
编译
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
gpu
使用虚拟机配置服务器

本文详细介绍了如何使用虚拟机配置服务器，包括购买云服务器的操作步骤、系统默认配置以及相关注意事项。通过这些步骤，您可以高效地配置和管理您的服务器。 ... [详细]

蜡笔小新 2024-11-12 12:12:27
gpu
解决Parallels Desktop错误15265的方法

本文详细介绍了在使用Parallels Desktop时遇到错误15265的多种解决方案，包括检查网络连接、关闭代理服务器和修改主机文件等步骤。 ... [详细]

蜡笔小新 2024-11-12 05:14:12