统计学 分类数据分析

统计学 分类数据分析

  • 分类数据和x2x^2统计量
  • 拟合优度检验
  • 列联分析: 独立性检验
  • 列联表的相关系(三个系数)

1.分类数据和x2x^2统计量

分类数据

统计学 分类数据分析

x2x^2统计量

统计学 分类数据分析
其中 k为求和的项数, l 为要估计的参数个数
具体的参数含义可以结合下面的案例来理解

2.拟合优度检验

直接进入案例

例1

统计学 分类数据分析

  • 步骤1:分析 H0与H1
    H0 :观察频数与期望频数一致

  • 步骤2: 构造统计量
    统计学 分类数据分析

    • 1.在本题中不用估计参数,参与求和的项数为2,所以自由度为2-0-1=1
    • 2.根据原来的男女比例估计期望的男女存活 的人数统计学 分类数据分析
    • 3.代入计算
  • 步骤3.得出结论
    统计学 分类数据分析

例2

统计学 分类数据分析

  • 步骤1:分析 H0与H1
    H0 :观察频数与期望频数一致
  • 步骤2: 构造统计量
    统计学 分类数据分析
    • 1.在本题中估计参数为λ,l=1,参与求和的项数为4,所以自由度为2-0-1=1
      注,这里的 k=4是因为手动把 >=3的数据都归为一类
      λ的估计: 因为H0假设服从参数为λ的泊松分布,泊松分布的表达式入下
      统计学 分类数据分析
      因此使用频数分布表计算出期望
      λ=0109/200+165/200+222/200+33/200+41/200=0.61000000000000010.61λ = 0*109/200 + 1*65/200+2*22/200+3*3/200+4*1/200=0.6100000000000001 ≈0.61
      根据泊松分布的表达式计算出k为0,1,2,3时的概率,得到下表统计学 分类数据分析
      带入公式求得统计量
  • 步骤3: 带入得出结论统计学 分类数据分析

3.列联分析: 独立性检验

RT/CT为该行/列的求和
统计学 分类数据分析
统计学 分类数据分析
话不多说,看例题来理解

例1

统计学 分类数据分析
统计学 分类数据分析
解析
H0:地区和原料等级之间是独立的(不存在依赖关系)
H1:地区和原料等级之间不独立 (存在依赖关系)
计算
其中45.36=140/500162/500500=140162/500=45.36=140/500*162/500*500=140*162/500=
统计学 分类数据分析
统计量
自由度为(3-1)*(3-1)=4
累加(5245.36)2/45.36(52-45.36)^2/45.36 以此类推
得出结论
统计学 分类数据分析

4.3个相关系数的计算

注,下文中的x2x^2均为统计量

统计学 分类数据分析统计学 分类数据分析
统计学 分类数据分析