连续性随机变量分布
均匀分布
若连续型随机变量X具有概率密度
则称X在区间(a,b)上服从均分分布,记为X~U(a,b)
在区间中任意等长度的子区间的可能性是相同的,落在(a,b)的子区间的概率值依赖于子区间的长度与子区间的位置无关。
分布函数:
指数分布
连续随机变量X的概率密度为
其中λ>0,为常数,则称X服从参数为λ的指数分布。在深度学习中,我们经常会需要一个x=0点处取得边界点的分布,而指数分布就可以达到这一目的。
指数分布示意图
分布函数:
期望:
方差:
在概率论和统计学中,指数分布是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。指数分布可以看作当威布尔分布中的形状系数等于1的特殊分布,指数分布的失效率是与时间t无关的常数,所以分布函数简单。
如何确定是指数分布:画出取对数后的互补累积分布函数(1-CDF(x)),如果数据服从指数分布,则是指数分布正态分布
连续随机变量X的概率密度为
其中, ,
(
>0)为常数,则X服从参数
,
的正态分布或高斯分布,记为
正态分布示意图
当 时,正态分布就成为了标准正态分布。
标准正态分布示意图
正态分布有两个参数,期望和标准差
,方差
^2。
分布函数:
图像特点:
(1)集中性:正态曲线的高峰位于正中央,即均数所在的位置。
(2)对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
(3)均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
参数性质:
(1)曲线关于x= 对称。
(2)当x= 时得到了最大值f(
)。
在x=±
处曲线有拐点,如果固定
,改变
的值,则图片沿着Ox轴为渐近线,可见正态分布的概率密度曲线y=f(x)的位置完全由参数
所确定,
称为位置参数。
正态分布对线性变化和卷积运算是封闭的。性质如下:
(1)对于随机变量X服从正态分布,X'=aX+b(作为x的线性变换)也服从和X一样的分布时,证明该分布对线性变换是封闭的。
(2)对于X和Y都服从正态分布,Z=X+Y,W=X-Y,Z和W也服从正态分布时,则说明该分布对卷积操作也是封闭的。
如果一组数值做对数变换后服从正太分布,我们就称其服从对数正太分布。对数正太分布的CDF跟正太分布一样,只是用logx代替原来的x。
采用正态分布在很多应用中都是一个明智的选择。当我们缺乏关于某个数据上分布的先验知识而不知道该怎么选择形式时,正态分布时默认的比较好的分布。而我们现实中的很多分布都是接近正态分布的,在具有相同方差的所有可能的概率分布中,正态分布在实数上具有很大的不确定性,可以认为正态分布时对模型加入的先验知识量最少的分布。
参考文献
概率论与数理统计
深度学习
概率论与数理统计-同济大学