二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.证明)
二项分布最大值,泊松分布的推导,几何分布的推导 (概统2.应用)
1.二项分布
二项分布就是独立事件n重伯努利试验,每次试验只有A发生与不发生两种结果,求n次试验中恰好发生k次的概率。
P{X=k} = k=0,1,2,..n
q=1-p;
简记为 X~B(n,p)
[二项分布.问题1]:大家知道,二项分布中,当N趋于很大,p趋于0时,二项分布可以近似看作泊松分布,可以用泊松分布公式代替二项分布公式计算,泊松分布公式比二项分布公式简单。问,射击例子中,连续射n次,如果n很大,那么射中次数为k次的概率P{X=k}可以用泊松分布吗?
答:这主要看每次射中概率p,泊松分布的条件是n很大,p很小,n趋于无穷,p趋于0,n*p是一个常数,(这个常数是事件出现的频率或者总体平均值);如果射击手每次射击的射中概率p为零点几之类,是不可以用泊松公式计算的,因为泊松公式需要定义一个常数 ,这个常数它要么是单位时间内的发生次数,要么是一个集合个体总数N乘以每个个体发生的极小概率p,=N*p;在射击例子中,射中概率p并不是很小很小,无法定义单位时间内射中次数,也无法定义N,所以不能用泊松分布公式计算。必须用标准的二项公式计算。
所以说,射击n次,射中k次的概率,是典型的二项分布的实例。
[二项分布.问题2: k取多少时,二项分布P{X=k}达到最大值?]
二项分布的公式是
P{X=k} = k=0,1,2,..n, q=1-p;
记为 X~B(n,p)
k等于多少时,P{X=k}达到最大值?具有最大值?
可以采用比值法,因为二项分布的P(X)分布律的函数趋势与泊松分布,与正态分布类似,都是先逐渐向上,再逐渐向下,中间有一个最大值。
【二项分布,n很大,p趋于0时,演变成泊松分布;泊松分布,当随机变量取连续值时,演变成正态分布】
图形在最大值前单调增,最大值后单调减
可以采用比值法,但是有两个比值
k>=0 , 由 大于1(单调增),转为小于1(单调减),等于1时,k最大
k>=1 , 由 大于1(单调增),转为小于1(单调减),等于1时,k最大
计算, >=1 ;(1),k的值
再计算, >=1 ;(2),k的值
设 q=1-p;
展开计算(1)式
= = =
= = >=1
得到
(n-k)p >= (k+1)(1-p)
np-kp >= k+1 -kp -p
最后得到
k<=(n+1)p -1 ;(3)
展开计算(2)式
===
= = >=1
得到
(n-k+1)p >= k(1-p)
np-kp+p >= k-kp
最后得到
k<=(n+1)p ;(4)
==
k<=(n+1)p -1 ; (3)
k<=(n+1)p ;(4)
结合(3)和(4),
当 (n+1)p 刚好为整数时(没有余数,没有小数点后面)
k的最大值有两个,分别是
k1=(n+1)p -1
k2=(n+1)p
当 (n+1)p 不为整数时(有余数,有小数点后面的数),只有一个最大值,
取(4)的整数部分(向下取整) ,floor((n+1)p); 向下取整数部分
k= floor( (n+1)p ) = (n+1)p ;
2. 二项分布演变到泊松分布的推导
大家知道二项分布当n很大,p很小,p趋于0时,即 , np= , 是一个常数的情况下,可以用泊松分布近似代替二项分布。那么怎样推导呢?下面是推导过程**
泊松分布的公式:
P{X=k} = , (k=0,1,2,…)
当取单位时间 t=1时,泊松分布的公式简化为:
P{X=k} = , (k=0,1,2,…)
简记为:X~
由二项分布的公式得,
P{X=k} = k=0,1,2,..n
其中,q=1-p;
当,,时
P{X=k} =
=
=
= (1)
注:对于 总共有k项(从(n-0) 到 (n-(k-1)) )
当 时,k是一个有限数(n是总样本数,k是发生故障的次数),k与n相加减,k可以忽略掉,
(k被忽略掉了)
同理:
(k被忽略掉了)
接上面(1)式,
当,,时
(1)式等于,
P{X=k} =
(2)
又注:n*p 意味着单位时间内发生的次数,定义为一个常数,
=n*p ,
接上面(2)式就等于,
当,,时
P{X=k} =
=
=
= (3)
又注:设 ,
那么 ,
= - =
因为 , 所以, ,
那么,上面(3)式就得到:
当,,时
P{X=k} =
= (4)
又注: 由e的定义式(e的公式)得:
每次加无限小分份量,再累积无限多次{n},就是e
参考:对自然数e的理解,e的证明,e的计算(基础)
e=
e=
在那篇博文有证明得出,n无论趋于正无穷,还是趋于负无穷,结果都是e
因此得:
====的证明方法:
设, 利用 ;
===
直观理解,如果t趋于负无穷,那么指数(t)就是累积除的关系,
每次减无限小分份量,但是累积除以无限多次{t},还是等于e
那么,上面(4)式就得到:
当,,时
P{X=k} =
= =
P{X=k} = , (k=0,1,2,…)
如果用单位时间内发生次数来表达, 可以表示成
上式可以表示成:
当,,时
P{X=k} = , (k=0,1,2,…)
3.泊松分布公式与 自然数 的定义 e
参考前面博文对自然数e的理解,证明,计算(基础)
=
= 1+x+
===
近似计算(e<4)的情况,e的指数越大,后面的项越大,越需要多项展开):
= 1+x+=====
思考问题:
的泰勒级数展开多项式中,哪一项的值最大?
答案是:x等于多少就是哪项值最大,恰好第x项的值最大。
可以参考前面博文对自然数e的理解,证明,计算(基础)
物理意义:单位时间内事件发生的次数最大可能性就是平均概率。
===
比如x=1,第一项最大 x=1。
x=2: 第一项及第二项 都是最大;
x=3,第三项 最大=4.73;
x=4,第四项 最大=12;
以此类推….
可以看到 其实就是 的第k项。
也就是等于说,P{X=k}的概率,就是 的第k项 的占比例。
[泊松分布.问题1,泊松分布P{x=k},k等于多少时,P{X=k}最大?]
已知泊松分布的公式,
P{X=k} = , (k=0,1,2,…)
记为 X~P()
P{X=k}的值,就是 的第k项 的占比例, 那么 k等于多少时,P{X=k}最大?
从直观上理解,单位时间最有可能发生的次数当然是平均数。
从e的泰勒展开多项式理解,的泰勒展开式,就是第项值最大。
也就是 k = 时, P{X=} 取得最大值。
4.二项分布到几何分布的推导
几何分布也是从二项分布而来。实际背景是重复独立试验下首次成功的概率(n重伯努利试验,首次成功的 n 值)
举例:射击n次,首次射中时的n值。
有放回地抽取样品,首次抽到次品时的抽取次数。
二项分布公式,重复试验n次,成功k次的概率:
P{X=k} = k=0,1,2,..n
重复试验n次,成功1次的概率:
P{X=1} =
成功的这一次,恰好是第一次的概率
从1到n,一共射击了n次,如果射击n次仅成功1次,成功的这一次有可能是是第1次,有可能是第2次,,,有可能是第n次,共有n种可能,
所以,成功的这一次,恰好是第一次的概率 = = =
所以,几何分布公式(事件首次发生的n值分布):
P{X=n} = ;
纪为 X~G(p)