变量(3)–离散随机变量与分布

定义:

若随机变量X只取有限多个可列无限多个值,则称X为离散型随机变量。比如投一个色子出现的点数X,取值范围是{1,2,3,4,5,6};110报警台一天接到的报警次数Y,取值范围为{0,1,2……}

设X为离散型随机变量,它的一切可能取值为X1,X2,……,Xn,……,

p(xn)=P{X=xn,n=1,2

这个函数为随即变量X的概率函数,又称为X的概率分布,简称分布

离散型随机变量的概率分布有两条基本性质:

(1)Pn≥0    n=1,2,…

(2)∑pn=1

对于集合{xn,n=1,2,……}中的任何一个子集A,事件“X在A中取值”即“X∈A”的概率为P{X∈A}=∑p(n)

 

一、伯努利随机变量(两点分布)

特别的,如果一个试验所包含的事件只有两个,其概率分布为

P{X=x1}=p(0

P{X=x2}=1-p=q

这种分布称为两点分布。 如果x1=1,x2=0,有   P{X=1}=p   P{X=0}=q   这时称X服从参数为p的0-1分布,它是离散型随机变量分布中最简单的一种。由于是数学家伯努利最先研究发现的,为了纪念他,我们也把服从这种分布的试验叫伯努利试验。习惯上,把伯努利的一种结果称为“成功”,另一种称为“失败”。

说明:1.随机变量ξ或η的特点:(1)可以用数表示;(2)试验之前可以判断其可能出现的所有值;(3)在试验之前不可能确定取何值。

 

二、二项分布

二项分布即重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布就是伯努利分布

如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是

P(ξ=K)= C(nk) * pk (1-p)(n-k), 其中C(n, k) = n!/(k! * (n-k)!)注意!:第二个等号后面的括号里的是上标,表示的是方幂。

记作ξ~B(n,p)期望:Eξ=np

方差:Dξ=npq

证明:由二项式分布的定义知,随机变量X是n重伯努利实验中事件A发生的次数,且在每次试验中A发生的概率为p.因此,可以将二项式分布分解成n个相互独立且以p为参数的(0-1)分布随机变量之和.

设随机变量X(k)(k=1,2,3…n)服从(0-1)分布,则X=X(1)+X(2)+X(3)….X(n).

因X(k)相互独立,所以期望:E(X)=E[X(1)+X(2)+X(3)….X(n)]=np.

方差:D(X)=D[X(1)+X(2)+X(3)….X(n)]=np(1-p).

证毕.

如果

1.在每次试验中只有两种可能的结果,而且是互相对立的;

2.每次实验是独立的,与其它各次试验结果无关;

3.结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努利实验。

在这试验中,事件发生的次数为一随机事件,它服从二次分布.二项分布可以用于可靠性试验。可靠性试验常常是投入n个相同的式样进行试验T小时,而只允许k个式样失败,应用二项分布可以得到通过试验的概率.

 

三、几何分布

几何分布(Geometric distribution)是离散型概率分布。其中一种定义为:在n次伯努利试验中,试验k次才得到第一次成功的机率。每次成功的概率为p。详细的说,是:前k-1次皆失败,第k次成功的概率。

p(x)=P(X=k)=(1-p)k-1p  ,k=1,2,3……

 

四、负二项分布

负二项分布”与“二项分布”的区别在于:“二项分布”是固定试验总次数N的独立试验中,成功次数k的分布;而“负二项分布”是直到成功r次时即终止的独立试验中。

k次实验,每次成功概率为p,连续独立实验k次直到成功r次

P(ξ=K)= C(k-1r-1) * pr (1-p)(k-r)

 

五、超几何分布

超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。

在产品质量的不放回抽检中,若N件产品中有M件次品,抽检n件时所得次品数X=k,则P(X=k)=C(M k)·C(N-M n-k)/C(N n, C(a b)为古典概型的组合形式,a为下限,b为上限,此时我们称随机变量X服从超几何分布(hypergeometric distribution)

(1)超几何分布的模型是不放回抽样

(2)超几何分布中的参数是M,N,n上述超几何分布记作X~H(n,M,N)

 

六、泊松分布

参数为λ(λ>0)的泊松频率是

P(X=k)= (λk/k!)eλ,k=0,1,2,3……

当实验次数n趋向于无穷,试验成功的概率p趋向于0,且满足np=λ时,泊松分布可由二项分布的极限得到。

 

ps:

泊松分布还需要花点时间来理解一下!

 

参考资料:

梳理统计与数据分析(具体详见这本书)

二项分布http://baike.baidu.com/view/79831.htm?fr=aladdin

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注