二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.证明)

二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.应用)

1.二项分布

二项分布就是独立事件n重伯努利试验,每次试验只有A发生与不发生两种结果,求n次试验中恰好发生k次的概率。

P{X=k} = Cnkpkqnk,k=0,1,2,..n
q=1-p;

简记为 X~B(n,p)

[二项分布.问题1]:大家知道,二项分布中,当N趋于很大,p趋于0时,二项分布可以近似看作泊松分布,可以用泊松分布公式代替二项分布公式计算,泊松分布公式比二项分布公式简单。问,射击例子中,连续射n次,如果n很大,那么射中次数为k次的概率P{X=k}可以用泊松分布吗?

答:这主要看每次射中概率p,泊松分布的条件是n很大,p很小,n趋于无穷,p趋于0,n*p是一个常数λ,(这个常数是事件出现的频率或者总体平均值);如果射击手每次射击的射中概率p为零点几之类,是不可以用泊松公式计算的,因为泊松公式需要定义一个常数λ ,这个常数它要么是单位时间内的发生次数,要么是一个集合个体总数N乘以每个个体发生的极小概率p,λ=N*p;在射击例子中,射中概率p并不是很小很小,无法定义单位时间内射中次数,也无法定义N,所以不能用泊松分布公式计算。必须用标准的二项公式计算。
所以说,射击n次,射中k次的概率,是典型的二项分布的实例。

[二项分布.问题2: k取多少时,二项分布P{X=k}达到最大值?]
二项分布的公式是
P{X=k} = Cnkpkqnk,k=0,1,2,..n, q=1-p;
记为 X~B(n,p)
k等于多少时,P{X=k}达到最大值?具有最大值?

可以采用比值法,因为二项分布的P(X)分布律的函数趋势与泊松分布,与正态分布类似,都是先逐渐向上,再逐渐向下,中间有一个最大值。
【二项分布,n很大,p趋于0时,演变成泊松分布;泊松分布,当随机变量取连续值时,演变成正态分布】
二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.证明)
图形在最大值前单调增,最大值后单调减
可以采用比值法,但是有两个比值
k>=0 , P(X=(k+1))P(X=k) 由 大于1(单调增),转为小于1(单调减),等于1时,k最大

k>=1 , P(X=k)P(X=(k1)) 由 大于1(单调增),转为小于1(单调减),等于1时,k最大

计算,P(X=(k+1))P(X=k) >=1 ;(1),k的值

再计算,P(X=k)P(X=(k1)) >=1 ;(2),k的值

设 q=1-p;

展开计算(1)式
P(X=(k+1))P(X=k) = Cnk+1pk+1qnk1Cnkpkqnk = Cnk+1Cnkpq =n!(nk1)!(k+1)!n!(nk)!k!p1p
=(nk)!k!(nk1)!(k+1)!p1p =nkk+1p1p >=1
得到
(n-k)p >= (k+1)(1-p)
np-kp >= k+1 -kp -p
最后得到
k<=(n+1)p -1 ;(3)

展开计算(2)式
P(X=k)P(X=(k1))=CnkpkqnkCnk1pk1qnk+1=CnkCnk1pq=n!(nk)!k!n!(nk+1)!(k1)!p1p
= (nk+1)!(k1)!(nk)!k!p1p = nk+1kp1p >=1
得到
(n-k+1)p >= k(1-p)
np-kp+p >= k-kp
最后得到
k<=(n+1)p ;(4)
==
k<=(n+1)p -1 ; (3)
k<=(n+1)p ;(4)
结合(3)和(4),
(n+1)p 刚好为整数时(没有余数,没有小数点后面)
k的最大值有两个,分别是
k1=(n+1)p -1
k2=(n+1)p
(n+1)p 不为整数时(有余数,有小数点后面的数),只有一个最大值,
取(4)的整数部分(向下取整) ,floor((n+1)p); 向下取整数部分
k= floor( (n+1)p ) = (n+1)p ;


2. 二项分布演变到泊松分布的推导

大家知道二项分布当n很大,p很小,p趋于0时,即n,p0 , np= λλ 是一个常数的情况下,可以用泊松分布近似代替二项分布。那么怎样推导呢?下面是推导过程**

泊松分布的公式:
P{X=k} = (λt)kk!e(λt) , (k=0,1,2,…)
当取单位时间 t=1时,泊松分布的公式简化为:
P{X=k} = λkk!eλ , (k=0,1,2,…)

简记为:X~P(λ)


由二项分布的公式得,
P{X=k} = Cnkpkqnk,k=0,1,2,..n
其中,q=1-p;

当,limtp0,时
P{X=k} = Cnkpk(1p)nk
= n!(nk)!k!pk(1p)nk

=n(n1)(n2)...(n(k1))(nk)!(nk)!k!pk(1p)nk

=n(n1)(n2)...(n(k1))k!pk(1p)nk (1)

注:对于 n(n1)(n2)...(n(k1)) 总共有k项(从(n-0) 到 (n-(k-1)) )
n时,k是一个有限数(n是总样本数,k是发生故障的次数),k与n相加减,k可以忽略掉,
limn>(n(n1)(n2)...(n(k1))) nk (k被忽略掉了)
同理:
limn>(1p)nk (1p)n (k被忽略掉了)

接上面(1)式,
当,limtp0,时
(1)式等于,
P{X=k} =n(n1)(n2)...(n(k1))k!pk(1p)nk

=nkk!pk(1p)nk

=nkk!pk(1p)n (2)

又注:n*p 意味着单位时间内发生的次数,定义为一个常数λ,
λ=n*p , n=λp

接上面(2)式就等于,
当,limtp0,时
P{X=k} =nkk!pk(1p)n

= (np)kk!(1p)n

= λkk!(1p)n

= λkk!(1p)λp (3)

又注:设 t=1p ,
那么 , p=1t,(1p)=(1+1t)
λp = -λt =t(λ)
(1p)λp=(1+1t)t(λ)
因为 p0, 所以,t , t

那么,上面(3)式就得到:
当,limtp0,时
P{X=k} = λkk!(1p)λp
= λkk!(1+1t)t(λ) (4)

又注: 由e的定义式(e的公式)得:
每次加无限小分份量1n,再累积无限多次{n},就是e
参考:对自然数e的理解,e的证明,e的计算(基础)
e=limn>(1+1n)n
e=limn>(1+1n)n
在那篇博文有证明得出,n无论趋于正无穷,还是趋于负无穷,(1+1n)n结果都是e
因此得:limt(1+1t)t=e
====

n 的证明方法:
n=1x, 利用 limx0(1+x)1n=e;
===
直观理解,如果t趋于负无穷,那么指数(t)就是累积除的关系,
每次减无限小分份量1t,但是累积除以无限多次{t},还是等于e
limt(1+1t)t=e

那么,上面(4)式就得到:
当,limtp0,时
P{X=k} = λkk!(1+1t)t(λ)

= λkk!(e)λ = λkk!eλ

P{X=k} = λkk!eλ , (k=0,1,2,…)

如果用单位时间内发生次数来表达,λ 可以表示成 λt
上式可以表示成:
当,limtp0,时
P{X=k} = (λt)kk!e(λt) , (k=0,1,2,…)


3.泊松分布公式与 自然数 的定义 e

参考前面博文对自然数e的理解,证明,计算(基础)

ex = i=0(x)ii!
ex = 1+x+(x)22!+(x)33!+...+(x)n1n!
===
近似计算(e<4)的情况,e的指数越大,后面的项越大,越需要多项展开):
ex = 1+x+(x)22+(x)36+(x)424+(x)5120

=====
思考问题:
ex的泰勒级数展开多项式中,哪一项的值最大?
答案是:x等于多少就是哪项值最大,恰好第x项的值最大。
可以参考前面博文对自然数e的理解,证明,计算(基础)
物理意义:单位时间内事件发生的次数最大可能性就是平均概率。
===
比如x=1,第一项最大 x=1。
x=2: 第一项及第二项 都是最大(x)22=222=2
x=3,第三项 最大(x)36=336=4.73;
x=4,第四项 最大(x)424=4424=25624=12;
以此类推….

可以看到 λkk! 其实就是 eλ 的第k项。
也就是等于说,P{X=k}的概率,就是eλ 的第k项 的占比例。

[泊松分布.问题1,泊松分布P{x=k},k等于多少时,P{X=k}最大?]
已知泊松分布的公式,
P{X=k} = λkk!eλ , (k=0,1,2,…)
记为 X~P(λ)

P{X=k}的值,就是eλ 的第k项 的占比例, 那么 k等于多少时,P{X=k}最大?

从直观上理解,单位时间最有可能发生的次数当然是平均数。
从e的泰勒展开多项式理解,eλ的泰勒展开式,就是第λ项值最大。

也就是 k = λ 时, P{X=λ} 取得最大值。


4.二项分布到几何分布的推导

几何分布也是从二项分布而来。实际背景是重复独立试验下首次成功的概率(n重伯努利试验,首次成功的 n 值)
举例:射击n次,首次射中时的n值。
有放回地抽取样品,首次抽到次品时的抽取次数。

二项分布公式,重复试验n次,成功k次的概率:
P{X=k} = Cnkpkqnk,k=0,1,2,..n

重复试验n次,成功1次的概率:
P{X=1} = Cn1p(1p)n1,

成功的这一次,恰好是第一次的概率
从1到n,一共射击了n次,如果射击n次仅成功1次,成功的这一次有可能是是第1次,有可能是第2次,,,有可能是第n次,共有n种可能,
所以,成功的这一次,恰好是第一次的概率 = P(X=1)n = Cn1p(1p)n1n =p(1p)n1

所以,几何分布公式(事件首次发生的n值分布):

P{X=n} = p(1p)n1

纪为 X~G(p)