7.7 回归中的相关度和R平方值
1. 皮尔逊相关系数(Pearson Correlation Coefficient )
1.1 衡量两个值线性相关强度的量
1.2 取值范围:【-1,1】:
正相关: > 0 负相关:
< 0 不相关:
= 0
1.3 计算公式:
2.计算方法举例:
X | Y | X_bar | Y_bar | X-X_bar | Y-Y_bar | (X-X_bar)(Y-Y_bar) | (X-X_bar)^2 | (Y-Y_bar)^2 | |
1 | 10 | 5.6 | 20.2 | -4.6 | -10.2 | 46.92 | 21.16 | 104.04 | |
3 | 12 | 5.6 | 20.2 | -2.6 | -8.2 | 21.32 | 6.76 | 67.24 | |
8 | 24 | 5.6 | 20.2 | 2.4 | 3.8 | 9.12 | 5.76 | 14.44 | |
7 | 21 | 5.6 | 20.2 | 1.4 | 0.8 | 1.12 | 1.96 | 0.64 | |
9 | 34 | 5.6 | 20.2 | 3.4 | 13.8 | 46.92 | 11.56 | 190.44 | |
sum | 28 | 101 | 28 | 101 | 0 | 0 | 125.4 | 47.2 | 376.8 |
r | 0.940310077 |
相关度 = 0.94 说明X和Y相关性非常强
3.其他例子:
4.R平方值:
4.1 定义:决定系数,反应因变量的全部变异能通过回归关系被自变量解释的比例
4.2 描述:如R平方为0.8,则表示回归关系可以解释因变量80%的变异。换句话说,如果我们能控制自变量不变,则因变量的变异会减少80%
4.3 简单线性回归:R^2 = r * r
多元线性回归:
5.R平方也有其局限性:R平方随着自变量的增加会增大,R平方和样本量是有关系的。因此,我们要将R平方进行修正。修正的方法: