超几何分布:
超几何分布描述的是从有限总体中无放回抽样的情况。假设一个容器中有N个球,其中m个是白球,N-m个是黑球。从中随机抽取n个球(不放回),设X为取出的白球数,则X服从参数为(n, m, N)的超几何分布。
其概率质量函数为:
X的期望可以通过组合公式进行计算,具体如下:
几何分布:
几何分布在独立重复试验中应用广泛,每次试验成功的概率为p。我们关注的是首次成功所需的试验次数n及其对应的概率。其概率质量函数为:
验证其作为分布列的性质:
几何分布的期望可通过定义式推导得出,设q = 1-p:
二项分布:
二项分布基于伯努利试验,即每次试验只有两种可能结果(成功或失败)。设在n次独立重复试验中,每次试验成功的概率为p,随机变量X表示成功的次数,则X服从参数为(n, p)的二项分布。
其概率质量函数为:
关于二项分布的期望和方差,可以通过组合公式和递推关系求得:
当k = (n+1)p时,P{X=k}达到最大值。
负二项分布:
负二项分布可以看作是几何分布的推广,描述了在n次独立重复试验中恰好成功r次的概率。设随机变量X表示第r次成功发生在第n次试验中的次数,则X服从参数为(r, p)的负二项分布。
其概率质量函数为:
通过巴拿赫火柴问题举例说明负二项分布的应用。假设一个数学家随身携带两盒火柴,每盒有N根火柴,他每次随机从其中一个盒子取一根火柴。当他第一次发现一个盒子空了时,另一个盒子恰好有k根火柴的概率为:
最终结果需要将该概率平方。
负二项分布的期望E[X]可以通过建立递推关系得到:
泊松分布:
泊松分布是二项分布的极限形式,当n趋近于无穷大且np=λ保持常数时,二项分布可近似为泊松分布。其概率质量函数为:
泊松分布的期望和方差均为λ:
推导过程中使用了泰勒级数展开,具体内容详见《托马斯大学微积分》专栏。