统计学 分类数据分析
统计学 分类数据分析
- 分类数据和统计量
- 拟合优度检验
- 列联分析: 独立性检验
- 列联表的相关系(三个系数)
1.分类数据和统计量
分类数据
统计量
其中 k为求和的项数, l 为要估计的参数个数
具体的参数含义可以结合下面的案例来理解
2.拟合优度检验
直接进入案例
例1
-
步骤1:分析 H0与H1
H0 :观察频数与期望频数一致 -
步骤2: 构造统计量
- 1.在本题中不用估计参数,参与求和的项数为2,所以自由度为2-0-1=1
- 2.根据原来的男女比例估计期望的男女存活 的人数
- 3.代入计算
-
步骤3.得出结论
例2
-
步骤1:分析 H0与H1
H0 :观察频数与期望频数一致 -
步骤2: 构造统计量
- 1.在本题中估计参数为λ,l=1,参与求和的项数为4,所以自由度为2-0-1=1
注,这里的 k=4是因为手动把 >=3的数据都归为一类
λ的估计: 因为H0假设服从参数为λ的泊松分布,泊松分布的表达式入下
因此使用频数分布表计算出期望
根据泊松分布的表达式计算出k为0,1,2,3时的概率,得到下表
带入公式求得统计量
- 1.在本题中估计参数为λ,l=1,参与求和的项数为4,所以自由度为2-0-1=1
-
步骤3: 带入得出结论
3.列联分析: 独立性检验
RT/CT为该行/列的求和
话不多说,看例题来理解
例1
解析
H0:地区和原料等级之间是独立的(不存在依赖关系)
H1:地区和原料等级之间不独立 (存在依赖关系)
计算
其中
统计量
自由度为(3-1)*(3-1)=4
累加
得出结论
4.3个相关系数的计算
注,下文中的均为统计量