整理总结:深入浅出统计学——离散概率分布的运用
参考资料:电子工业出版社的《深入浅出统计学》
前言
概率可以得知发生事件的可能性,但无法指出所发生的的这些事情的整体影响,也无法指出这种整体影响对我们的具体影响,通过期望来预测长期结果,并利用方差来度量这些预测结果的确定性。
本篇目录
具体内容
一、概率分布
若有一台老虎机,只有三个窗口全部恰到好处时,才会有成堆的硬币滚滚而下,并且每局特定组合对应的客户收益规则和一台老虎机的每个窗口出现特定图像的概率如下
那么通过对每一情况进行概率计算, 赢局的概率分布应如下
二、期望
期望如常规数据的均值,只能给出位于中心的典型值。通过期望,来判断出在典型情况下可以期望每一局赢多少或赔多少。
其意义是在多次拉杆后,我们能够期望每一局赔掉0.77美元,也就是说,如果玩100次老虎机,我们会期望赔掉77美元。
三、方差
方差用来全面体现出结果的分散性,换句话说是体现出每一局赌局有可能存在的收益变化。
四、标准差
概率分布的标准差和数据集的标准差作用相似,是一种度量数据与数据中心的期望距离的方法。
如老虎机收益的标准差则是,即1.642,这表示从平均情况来看,我们的每一局收益与期望收益-0.77之间的距离是1.642。一般而言,标准差高的老虎机表示整体收益变化大得多,整体上的赢钱数额更不可预期。
五、单个随机变量的线性变换——Z=aX+b
现在假设老虎机每一局拉杆的赌本是1美元变成了2美元,而赢金翻了5倍。此时赢局新的概率分布应如下
此时若要求出新随机变量Y的期望和方差,可以不需要再进行公式复杂的运算,可以直接借助与Y有线性关系的X的期望和方差,可以看出Y=5X+3。
值得注意地是,此时只是数值变成新值——收益,但基础概率仍保持不变。
六、多个随机变量的复合——Z=X1+X2
当我们想在一台老虎机上玩两局时,那么我们仍需要重新计算概率分布,但需要注意地是此时不仅数值变成新值,同时基础概率也发生了变化。
若记第一局的收益变量为X1,而第二局的收益变量为X2,那么W=X1+X2的期望和方差应为如下
需要注意的是,此时W是X1+X2,而非W=2X1,因为在这个背景下W的基础概率发生了变化。此类变化也可以引申至一共玩两局,每局玩不同的老虎机,此时两台老虎机对应的概率分布互不相同,W=X+Y。
七、多个随机变量的复合的进阶——Z=aX+b+cY+d
若一共玩两局,每一局用不同的老虎机,此时已求出W1=X+Y,当两台老虎机的本金和赢金规则均发生变化,即每一台数值变成新数值但基础概率都没有发生变化,对应的线性变换分别为aX+b,cY+d,那么两局对应的概率分布应为W2=aX+b+cY+d,此时W2的期望和方差可以通过EX、DX、EY和DY直接计算。