[统计学笔记] 方差分析表的解读
方差分析表的解读
方差分析表(analysis of variance table)是指为了便于进行数据分析和统计判断,按照方差分析的过程,将有关步骤的计算数据,例如差异来源、离差平方和、自由度、均方和F检验值等指标数值逐一列出,以方便检查和分析的统计分析表。
利用 Excel 中数据分析的功能可以快速构造出方差分析表。
方差分析表(Analysis of variance table)可以用下面的表格来表示,其各个数据的含义解读如下:
利用方差分析表作出统计决策
1. 提出假设
:
,自变量对因变量没有显著影响。
:
,
,..,
不全相等,自变量对因变量有显著影响。
2. 计算有关均值
为了便于分析,设单因素方差分析的数据结构如下表所示。
观察值序号( |
因素(i) | |||
A1 | A2 |
…… |
Ak | |
1 |
|
|
……
|
|
2 |
|
|
……
|
|
|
|
|
|
|
n |
|
|
……
|
|
因素A的k个水平用 ,
,……
表示,
表示第
个水平(总体)第
个观察值。从不同水平中所抽取的样本容量可以相等,也可以不等。
① 令 表示第
个总体的样本均值,则
,
其中, 为第 i 个总体的样本观察值个数。
② 令总均值为 ,则
,
式中,
3. 计算误差平方和
① 总误差平方和SST。它是全部观察值 与总平均值
的误差平方和,反映全部观察值的离散程度。
② 水平项误差平方和SSA。它是各组平均值
与总平均值
的误差平方和,反映了各水平总体的样本均值之间的差异程度,因此又称为组间平方和。
③ 误差项平方和SSE。它是每个水平或各组的各样本数据与其组平均值误差的平方和,反映了每个样本各观察值的离散状况,因此又称为组内平方和或残差平方和。
4. 计算统计量
①组间均方MSA。MSA计算公式为
②组内均方MSE。MSE的计算公式为
③ 检验统计量F。F是MSA与MSE的比值, ~
5. 做出统计决策
计算出统计量F的值后,根据给定的显著性水平α,在F分布表中查找分子自由度为(k-1)、分母自由度为n-k的相应临界值。
若,则拒绝原假设
;
若,则不拒绝
。
6. 总结
1、方差分析表一般是反映一组或多组变量数据偏离平均值的波动大小的表格数据。方差也称平方差。
2、首先分析表格中有哪些数据,如组数,然后分析是单因素还是多因素影响的数据。
3、分析他们之间的变化关系,求出组中值或平均值,然后观察表格,比较方差大小。
4、在平均数确定的情况下,方差越大,数据的性质越不稳定,波动越大;方差越小,数据的性质越稳定,波动小。
5、根据稳定或波动情况,分析数据的集中趋势,进行判断该项数据的特点,以及是否适合采用。
双因素方差分析
在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。
例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量,如果在不同的地区,销售量存在显著的差异,就需要分析原因。采用不同的销售策略, 使该饮料品牌在市场占有率高的地区继续深入人心,保持领先地位;在市场占有率低的地区,进一步扩大宣传,让更多的消费者了解、接受该产品。
若把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析的内容, 双因素方差分析是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。
双因素方差分析法的类型
双因素方差分析有两种类型:
- 一个是无交互作用的双因素方差分析,它假定因素A 和因素B的效应之间是相互独立的,不存在相互关系;
- 另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。
例如,若假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,这就是两个因素结合后产生的新效应,属于有交互作用的背景;否则,就是无交互作用的背景。有交互作用的双因素方差分析已超出本书的范围,这里介绍无交互作用的双因素方差分析。
上表中:
因素A位于列的位置,共有 个水平,
代表第
种水平的样本平均数;
因素B位于行的位置,共有 个水平,
代表第
种水平的样本平均数。
为样本总平均数,样本容量
。
每一个观察值 看作由A因素的
个水平和B因素的
个水平所组合成的
个总体中抽取样本容量为1的独立随机样本。
这 个总体的每一个总体均服从正态分布,且有相同的方差。这是进行双因素方差分析的假定条件。