7.超几何分布

超几何分布

超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。

在产品质量的不放回抽检中,若N件产品中有M件次品,抽检n件时所得次品数X=k,则

$$P(X=k)= {\frac { C_{M}^{k} C_{N-M}^{n-k} } {C_{N}^{n} } }$$

为古典概型的组合形式,a为下限,b为上限,此时我们称随机变量X服从超几何分布(hypergeometric distribution)

(1)超几何分布的模型是不放回抽样

(2)超几何分布中的参数是M,N,n上述超几何分布记作X~H(n,M,N)

例:在一个口袋中装有30个球,其中有10个红球,其余为白球,这些球除颜色外完全相同.游戏者一次从中摸出5个球.摸到至少4个红球就中一等奖,那么获一等奖的概率是多少?

解:由题意可见此问题归结为超几何分布模型。

其中N = 30. M = 10. n = 5.P(一等奖) = P(X=4 or 5) = P(X=4) + P(X=5)

由公式P(X=k)=C(k,M)*C(n-k,N-M)/C(n,N),k=0,1,2,…

得:

P(X=4) = C(4,10)*C(1,20)/C(5,30)

P(X=5) = C(5,10)*C(0,20)/C(5,30)

P(一等奖) = 1063393

跟几何分布的关系

  • 超几何分布需要知道总体的容量,而二项分布不需要;
  • 超几何分布是不放回抽取,而二项分布是放回抽取(独立重复),当总体的容量非常大时,超几何分布近似于二项分布。

参考资料:

《深入浅出统计学》

梳理统计与数据分析(具体详见这本书)

二项分布http://baike.baidu.com/view/79831.htm?fr=aladdin

个人公众号,比较懒,很少更新,可以在上面提问题:

更多精彩,请移步公众号阅读:

Sam avatar
About Sam
专注生物信息 专注转化医学