热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

概率论的学习和整理11:伯努利试验的3种分布:01分支,几何分布,二项分布

1伯努利试验1.1什么是伯努利试验伯努利试验伯努利试验是一个有两种结果的简单试验,它的结果是成功或失败,黑或白,开或关,

1 伯努利试验

1.1 什么是伯努利试验

伯努利试验

  • 伯努利试验是一个有两种结果的简单试验,它的结果是成功或失败,黑或白,开或关,没有中间的立场。
  • 每次试验的结果只有两个:事件发生或不发生,或多种结果归纳为高度抽象为两种

伯努利概型是一种基于独立重复试验的概率模型,它的基本特征:

  • 在一组固定不变的条件下重复地做一种试验。
  • 每次试验的结果只有两个:事件发生或不发生,或多种结果归纳为高度抽象为两种
  • 每次试验中,相同事件发生的概率均一样。(试验样本总数和概率不能变)
  • 各次重复试验的结果是相互独立,互不影响的。
  • 1重伯努利试验 就是 0-1分布
  • n 重伯努利试验 就是二项分布     p=C(n,k)*p^k*(1-p)^n-k

N重伯努利试验 和二项分布
 优势

  • 不要求具体的样本总量的具体 数量
  • 只需要知道概率就行,但要求概率是稳定不变的(多次伯努利试验时)
  • 还需要知道 抽样试验的次数,目标事件的次数

 局限性

  • 能不能用二项分布先判断,是不是符合N重伯努利试验,如果不符合就没戏
  • 二项分布,伯努利试验,需要保证样本容量确定,且分布也要稳定,否则不能
  • 必须是放回抽样
  • 如果是不放回抽样,

  1. 要么认为样本极其大,忽略样本总量变化,概率变化不稳定的影响
  2. 要么得用超几何分布

使用时注意点

  • 需要严格认识的地方:
  • N次试验,每次试验都稳定,样本总数和概率都稳定才能视为N重伯努利试验,才能用二项分布
  • 不放回抽样,一般不适合二项分布
  • 因为小样本量前提下,不放回抽样会破坏第一次试验后的样本空间数和概率,发生变化!第2次试验无法和第1次相同了
  • 如果样本量足够大,即使是不放会抽样,可以用二项分布近似


1.2 伯努利试验相关的3种分布


  • 0-1分布
  • 只进行1次伯努利试验的随机变量,符合0-1分布,f(x=k)=p^k*(1-p)^(1-k)
  • k={0,1}

  • 几何分布:
  • 进行n次伯努利试验,只有最后1次成功,成功次数第N次,N符合几何分布
  • f(x=k)=p*(1-p)^(k-1)
  • 其中 k 是总试验次数,一共进行了k次,且第k次(也就是最后1次)成功

  • 二项分布:
  • 进行N次伯努利试验,有k次成功,成功次数k符合二项分布
  • f(x=k)=C(n,k)*p^k*(1-p)^(n-k)
  • 其中n是总试验次数,k是成功次数(对应成功的概率p)



2 关于0-1分布 (也称为伯努利分布  \ ab分布 \ 两点分布等)

2.1 0-1分布的基本概率和公式

0-1分布:只进行1次伯努利试验的随机变量,结果只有2种,符合0-1分布

 一个随机事件,发生记为k=1,不发生记为k=0,若事件服从0-1分布,

则k的分布律为:      
               k      0       1                 
            p(k)    1-p    p          


  • 0-1分布的概率公式 f(x)=p^k*(1-p)^(1-k)
  • k={0,1}
  • 其实就是

  1. k=1时,f(x)=p 
  2. k=0时,f(x)=1-p

2.2 0-1分布的概率分布图,pdf 和 cdf


  • 0-1分布,因为只有1次试验
  • 只有两种结果
  • 所以分布图看起来就是这种直线。。。。

 kp1p2p3p4p5
pdf00.90.80.50.20.1
 10.10.20.50.80.9
cdf00.90.80.50.20.1
 111111


2.3 0-1分布的期望和方差                 


  • E(X)    = 0*(1-p)+1*p  =    p                
  • D(X)    =    p*(1-P)         
  • 缺少证明过程       

                                    
            

3  几何分布

3.1 什么是几何分布

几何分布就是一种定义为:在n次伯努利试验中,试验k次才得到第一次成功的机率。

详细地说是:前k-1次皆失败,第k次成功的概率。

  • 首先几何分布,属于古典概型/ 伯努利试验
  • 特点是:只有每次试验只可能有两种结果
  • 如果只做1次试验,那是属于0-1分布,但是如果做N次试验,但是只有最后一次成功,则随机变量符合 几何分布,但是如果做N次试验,没其他限制,则随机变量符合 二项分布
  • 由上可知,0-1分布,几何分布,应该都可以归纳为,二项分布的一种特例。


4 二项分布

4.1 什么是二项分布 和N重伯努利试验


  • 在概率论和统计学中,二项分布是n个独立的成功/失败试验中成功的次数的离散概率分布,
  • 其中每次试验的成功概率为p。
  • 其实,只有符合N重伯努利试验的随机变量,才可能服从二项分布!

  • 二项分布包含0-1分布和几何分布
  • 当n=1时,二项分布就是伯努利分布,也就是0-1分布,如果只有最后一次成功又是几何分布。

4.2 二项分布的公式


  • 一般地,如果随机变量服从参数为和的二项分布,我们记为或。n次试验中正好得到k次成功的概率由概率质量函数给出: 
  • p(x=k)=C(n,k)*p^k*(1-p)^(n-k)
  • 其中n是总试验次数,k是成功次数(对应成功的概率p)
  • 式中k=0,1,2,…
  • 而C(n,k)= n!/(n-k)!*k!  是二项式系数,(这就是二项分布名称的由来)

  •  该公式可以用以下方法理解:我们希望有k次成功(p)和n−k次失败(1 −p)。
  • 并且,k次成功可以在n次试验的任何地方出现,而把k次成功分布在n次试验中共有个C(n,k)不同的方法。

4.3 二项分布的两个概率的概念理解


  • 二项分布,指的是N次试验里成功k次的概率符合二项分布
  • 而内部的单次试验,是伯努利试验,其单次试验的概率p,是稳定不变的。


  • N 次试验里成功k次的概率的  k~~p(k) 情况 
  • p(k) 是 表示多次试验,且要求(n次出k次成功)的概率
  • p(k) 和单次试验的概率P不要混淆
     

4.4 二项分布概率分布函数


4.4.1 二项分布的pdf 和cdf 如图


  • 二项分布的pdf
  • 二项分布的cdf


4.4.2 二项分布的pdf 的变化

先看下整体图

  • 纵向是,单次伯努利试验的p提升
  • 横向是,试验次数n的增加
  • 内部里面是,坐标系的横轴是 n次试验成功次数k,k的概率变化

纵向看

  • 在总试验次数不变的前提下,随着 单次伯努利试验里,概率p的增加
  • 整个二项分布的波峰逐渐右移,意味着,波峰是概率最高的次数逐渐变大(概率越大,n次试验内成功k次,k也会越大,符合直觉)
  • 概率很小的时候,可能只成功0次,1次的概率很大,
  • 概率很大的时候,试验n次,k次成功的k越来越大,甚至接近n了

横向看

  • 在单次伯努利试验里,概率p不变的前提下,随着试验次数的增多
  • 整个二项分布的波峰逐渐右移,意味着,波峰是概率最高的次数逐渐变大(概率不变,n次试验内成功k次,试验次数n越多,k也会越大,符合直觉)
  • 但是概率不变前提下, 虽然成功的次数k变多了,但比例并不变(因为基础的单次伯努利试验的概率没变,这是横向变化的前提)


4.5 二项分布的期望和方差


  • 二项分布的期望
  • E(X)=n*p
  • 二项分布的方差
  • D(X)=n*p*(1-P)

缺乏推导过程


4.6 二项分布的一个例题


  • 如果像利用二项分布,需要灵活的去划分样本空间为2种结果,比如例题中的
  • 这样划分2种:这次抽样后需要调整机器  == 对应的变量是本次检验,次品数量>1

  1. 今天某次检查次品数>1==今天需要调整机器  / 对立今天不调整机器
  2. 每天检查4次,相当于做了4次伯努利试验
  3. 方法1,完全用了二项分布思路和解法
  4. 方法2,用了古典概型的,每次试验都是独立的,和加法原理加起来算的

  • 注意,为了达到目标事件,事件可能需要几次户型转化,随机变量可能要转化几次

 

 



推荐阅读
  • pdf怎么把html变成pdf1 用AdobeAcroat8.1.2,打开网页后,页面右键菜单中会出现一个“转换为AobePDF的选项,点击就可以转换。 安装AdobeAcroba ... [详细]
  • lm339引脚图参数及lm339 pdf中文
    LM339芯片内部装有四个独立的电压比较器,是很常见的集成电路。利用lm339可以方便的组成各种电压比较器电路和振荡器电路  ... [详细]
  • 我有点困惑-在这里创建ML模型。我正在尝试从“大”数据框(180列)中获 ... [详细]
  • 怎么把bmp转换成pdf?bmp转pdf格式软件推荐
     相信大家应该对图片格式有所了解,bmp就是其中的一种图片格式,而pdf是一种常见的文件格式。两者本来没有太大的练习,不过有些小伙伴在后台向我咨询,如何实现bmp转pdf ... [详细]
  • Splunk Enterprise 存在任意代码执行漏洞
    splunk,enterprise,存在,任 ... [详细]
  • ps怎么把多个图片文件转成pdf?PS是一款非常强大的图片处理软件,懂的都懂,是设计人员必备的图像软件。那么在PS里,怎么把多个图片文件转成pdf格式呢?一起来看 ... [详细]
  • NLP | 一文完全搞懂序列标注算法
    序列标注模型用到了长短期记忆网络(LSTM),条件随机场(CRF),Highway网络,本文循序渐进的介绍了序列标注算法,Bepatience!跟 ... [详细]
  • 深度强化学习Policy Gradient基本实现
    全文共2543个字,2张图,预计阅读时间15分钟。基于值的强化学习算法的基本思想是根据当前的状态,计算采取每个动作的价值,然 ... [详细]
  • 从去年11月开始,工作之余陆陆续续准备了半年的时间,在昨天考过了OCP的三门考试,Handson后等待审核通过。当初打算考这个认证也是为了争取一个工作机会想作为增加成功的砝码而准备的,可惜的是 ... [详细]
  • 本文目录一览:1、java中几种解析html的工具 ... [详细]
  • 读书这件事情
    读书这件事情2015-08-2408:01bystoneniqiu,17194阅读,157评论,收藏,编辑准确的说是自从不打DOTA了(也不玩其他的游戏),看的书也 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • Metasploit攻击渗透实践
    本文介绍了Metasploit攻击渗透实践的内容和要求,包括主动攻击、针对浏览器和客户端的攻击,以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码,以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • 如何使用迅捷PDF编辑器给PDF文件设置全屏动画
    本文介绍了使用迅捷PDF编辑器给PDF文件设置全屏动画的方法,包括安装软件、添加PDF文件、设置动画效果和页面范围等步骤,帮助用户实现PDF文件的全屏动画效果。操作简单,适用于华为全屏等设备。 ... [详细]
author-avatar
为什么不嫩注册
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有