数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

随机变量(random variable):对试验结果的数值描述
实际上,随机变量将每一个可能出现的试验结果赋予一个数值,随机变量的值取决于试验结果。随机变量根据取值可分为离散型或连续型。

离散型随机变量(discrete random variable):随机变量为离散的
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

连续型随机变量(continuous random variable):随机变量为某一区间或多个区间内的任意值
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

对于离散型随机变量x,概率函数(probability function)给出随机变量取每种值得概率,为f(x)当数据量相当大的时候,可以采用相对频率法为随机变量的值分配概率。这时,我们将数据看作总体,采用相对频率法为试验结果分配概率。采用相对频率法建立离散型概率分布得到所谓的经验离散分布( empirical discrete distribution)。
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

离散型随机变量的数学期望(expected value):对随机变量中心位置的一种度量
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

离散型随机变量的方差
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

二元概率分布(bivariate probability distribution):两个随机变量的概率分布
在一个二元试验中,每种试验结果由两个值构成,其中每个值与一个随机变量相对应。比如,在一个抛掷一对色子的二元试验中,试验结果由两个值构成,其中一个是第一枚色子的点数,另一个是第二枚色子的点数。再比如,观察金融市场上的一只股票基金和一只债券基金,记录它们在一年中的收益率。试
验结果给出随机变量的一对值,其中一个值是股票基金的收益率,另一个值是债券基金的收益率。在处理二元概率分布时,我们感兴趣的往往是随机变量之间的关系。
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记
随机变量x和y的协方差
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

随机变量x和y的相关系数
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

随机变量x和y的线性组合的数学期望
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

两个随机变量的线性组合的方差
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

在金融上的应用
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

二项实验(bionomial experiment)
二项试验的性质
1.试验由一系列相同的n个试验组成。
2.每次试验有两种可能的结果。我们把其中一个称为成功,另一个称为失败
3.每次试验成功的概率都是相同的,用p来表示;失败的概率也都相同,用1-p表示
4.试验是相互独立的。

在二项试验中,我们感兴趣的是在n次试验中成功出现的次数。如果令x代表n次试验中成功的次数,则x的可能值为0,1,2,3,…,n,由于随机变量取值的个数是有限的,所以x是一个离散型随机变量。与这一随机变量相对应的概率分布称为二项概率分布( binomial probability distribution)
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

比如:
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

二项概率函数( binomial probability function)
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

二项分布的数学期望与方差
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

泊松概率分布(Poisson probability distribution)
泊松试验的性质
1.在任意两个相等长度的区间上,事件发生的概率相等。
2.事件在某一区间上是否发生与事件在其他区间上是否发生是独立的。

泊松概率函数
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

在概率函数f(x)中,有x=0,1,2,…,即随机变量的取值有无限多种可能。在实际应用中,当x最终取值非常大时,f(x)近似为0。

例子:
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记

在前面的例子中,15分钟内恰有5辆汽车到达的概率是0.0378,这与3分钟内恰有1辆汽车到达的概率
(0.2707)是不同的。因此,在计算不同长度的时间段上的泊松概率时,必须先计算在相应区间上随机变量的平均到达率,然后再计算其概率。

泊松概率分布的一个重要性质是它的数学期望和方差相等。

超几何概率分布(hypergeometric probability distribution)
数据分析统计学原理第五章:离散型概率分布 | 我的统计学原理复习日记