#基本概念# 随机试验 / 样本空间 / 随机变量

 


 随机试验:

    对随机现象的观察、记录、实验统称为随机试验。它具有以下特性:

  • 可以在相同条件下重复进行;
  • 事先知道所有可能出现的结果;
  • 进行试验前不知道哪个试验结果会发生。

    随机试验有很多种,例如常出现的掷骰子,摸球,射击,抛硬币等。所有的随机试验的结果可以分为两类来表示:

  • 数量化表示:射击命中的次数,商场每个小时的客流量,每天经过某个收费站的车辆等,这些结果本身就是数字;
  • 非数量化表示:抛硬币的结果(正面/反面),化验的结果(阳性/阴性)等,这些结果是定性的,非数量化的。但是可以用示性函数来表示,例如可以规定正面(阳性)为1,反面(阴性)为0,这样就实现了非数量化结果的数量化表示。

 

样本空间:

    随机试验的所有可能结果构成的集合。一般即为S(大写的S)

    S中的元素e称为样本点(也可以叫做基本事件);

    事件是样本空间的子集,同样是一个集合;

 

事件的相互关系:

  • 事件的包含:A⊆B
  • 事件的相等:A=B
  • 事件的积(交):A∩B,AB
  • 互斥事件(互不相容事件):不能同时出现
  • 事件的和(并):A∪B
  • 事件的差:A-B,A发生,B不发生
  • 对立事件(逆事件):互斥,必需出现其中一个
    事件的运算性质就是集合的性质

 

频率与概率


 频率:

    频率是0~1之间的一个实数,在大量重复试验的基础上给出了随机事件发生可能性的估计。

    频率的稳定性:在充分多次试验中,事件的频率总在一个定值附近摆动,而且,试验次数越多摆动越小。这个性质叫做频率的稳定性。

 

概率:

    概率的统计性定义:当试验次数增加时,随机事件A发生的频率的稳定值p就称为概率。记为P(A)=p

    概率的公理化定义:设随机试验对于的样本空间为S。对每一个事件A,定义P(A),满足:

  1. 非负性:P(A) ≥ 0
  2. 规范性:P(S) = 1
  3. 可列可加性:A1, A2, ...两两互斥,及AiAj = ∅, i≠j,P(∪Ai) = ∑P(Ai)
    概率是随机事件的函数,对于不同的事件,取不同的值

 

条件概率:

    P(A|B)表示在事件B发生的条件下,事件A发生的概率,相当于AB中所占的比例。此时,样本空间从原来的完整样本空间S缩小到了B

    由于有了条件的约束(事件B),使得原来的样本空间减小了。

    #基本概念# 随机试验 / 样本空间 / 随机变量               #基本概念# 随机试验 / 样本空间 / 随机变量

图1:a.条件概率的样本空间;b.条件概率的计算公式

 

例:一个家庭中有两个小孩,已知至少一个是女孩,问两个都是女孩的概率是多少?

(假定生男生女是等可能的)

解:由题意,样本空间为

S = {(兄, 弟), (兄, 妹), (姐, 弟), (姐, 妹)}

B = {(兄, 妹), (姐, 弟), (姐, 妹)}

A = {(姐, 妹)}

由于事件B已经发生,所以这时试验的所有可能只有三种,而事件A包含的基本事件只占其中的一种,所以有:

P(A|B) = 1/3,

即在已知至少一个是女孩的情况下,两个都是女孩的概率为1/3

在这个例子中,如果不知道事件B发生,则事件A发生的概率为P(A) = 1/4

这里P(A) ≠ P(A|B),其原因在于事件B的发生改变了样本空间,使它由原来的S缩减为新的样本空间SB = B

 

随机变量


 在几乎所有的教材中,介绍概率论时都是从事件和样本空间说起的,但是后面的概率论都是围绕着随机变量展开的。可以说前面的事件和样本空间都是引子,引出了随机变量这个概率论中的核心概念。后面的统计学是建立在概率论的理论基础之上的,因此可以说理解随机变量这个概念是学习和运用概率论与数理统计的关键。

 

名词解释:

  • 首先这是一个变量,变量与常数相对,也就是说其取值是不明确的,其实随机变量的整个取值范围就是前面说的样本空间;
  • 其次这个量是随机的,也就是说它的取值带有不确定性,当然是在样本空间这个范围内。

 

定义:

设随机试验的样本空间是S。若对S中的每个样本点e,都有唯一的实数值X(e)与之对应,则称X(e)为随机变量,简记为X。

 #基本概念# 随机试验 / 样本空间 / 随机变量    #基本概念# 随机试验 / 样本空间 / 随机变量

 

图2:a.随机变量与事件的关系;b.随机变量的本质是函数(一种映射关系)

随机变量的定义并不复杂,但是理解起来却并不是那么直观。参考图2的两个示意图,可以帮助理解。

  • 首先,随机变量与之前定义的事件是有关系的,因为每个样本点本身就是一个基本事件;
  • 在前面随机试验结果的表示中提到,无论是数量化的结果还是非数量化的结果,即不管试验结果是否与数值有关, 都可以引入变量, 使试验结果与数建立对应关系;
  • 随机变量本质上是一种函数,其目的就是建立试验结果(样本空间中的点,同基本事件e)与实数之间的对应关系(例如将"正面"映射为1,"反面"映射为0);
  • 自变量为基本事件e,定义域为样本空间S,值域为某个实数集合,多个自变量可以对应同一个函数值,但不允许一个自变量对应多个函数值;
  • 随机变量X取某个值或某些值就表示某种事件,且具有一定的概率;
  • 随机变量中的随机来源于随机试验结果的不确定性;

 

随机变量的表示:

  • 随机变量通常用大写字母X, Y, Z或希腊字母ξ, η等表示;
  • 随机变量的取值一般用小写字母x, y, z等表示。

通过引入随机变量,我们简化了随机试验结果(事件)的表示,从而可以更加方便的对随机试验进行研究。

#基本概念# 随机试验 / 样本空间 / 随机变量

图3:从事件到随机变量

 
例:用X表示单位时间内某电话交换台收到的呼叫次数,它是一个随机变量。
  • 事件A=“收到不少于1次呼叫” <=> ( X >= 1 );
  • 事件B=“没有收到呼叫” <=> ( X = 0 ) ;
  • 而P(A) = P(X >= 1), P(B) = P(X = 0)。

 

随机变量的分类:

  • 离散型随机变量;
  • 连续型随机变量;
  • 每类随机变量都有其独特的概率密度函数和概率分布函数。

 

 随机变量的数字特征:

  • 期望(均值),众数,分位数,中位数;
  • 方差;
  • 协方差;
  • 相关系数。