7.7 回归中的相关度和R平方值

1. 皮尔逊相关系数(Pearson Correlation Coefficient )

    1.1 衡量两个值线性相关强度的量

    1.2 取值范围:【-1,1】:

          正相关:7.7 回归中的相关度和R平方值 > 0 负相关:7.7 回归中的相关度和R平方值 < 0 不相关:7.7 回归中的相关度和R平方值 = 0

    1.3 计算公式:

7.7 回归中的相关度和R平方值

7.7 回归中的相关度和R平方值

2.计算方法举例:

7.7 回归中的相关度和R平方值

 

 

 

  X Y X_bar Y_bar X-X_bar Y-Y_bar (X-X_bar)(Y-Y_bar) (X-X_bar)^2 (Y-Y_bar)^2
  1 10 5.6 20.2 -4.6 -10.2 46.92 21.16 104.04
  3 12 5.6 20.2 -2.6 -8.2 21.32 6.76 67.24
  8 24 5.6 20.2 2.4 3.8 9.12 5.76 14.44
  7 21 5.6 20.2 1.4 0.8 1.12 1.96 0.64
  9 34 5.6 20.2 3.4 13.8 46.92 11.56 190.44
sum 28 101 28 101 0 0 125.4 47.2 376.8
r 0.940310077                

相关度 = 0.94 说明X和Y相关性非常强

3.其他例子:

7.7 回归中的相关度和R平方值

4.R平方值:

  4.1 定义:决定系数,反应因变量的全部变异能通过回归关系被自变量解释的比例

  4.2 描述:如R平方为0.8,则表示回归关系可以解释因变量80%的变异。换句话说,如果我们能控制自变量不变,则因变量的变异会减少80%

  4.3  简单线性回归:R^2 = r * r

         多元线性回归:

                                         

7.7 回归中的相关度和R平方值

7.7 回归中的相关度和R平方值

7.7 回归中的相关度和R平方值

5.R平方也有其局限性:R平方随着自变量的增加会增大,R平方和样本量是有关系的。因此,我们要将R平方进行修正。修正的方法:

7.7 回归中的相关度和R平方值