回归分析-常用统计量含义解析

线性回归模型预测好坏，评判标准主要观察回归直线与各观测点的接近程度（即直线的拟合优度）。但是如何量化它们之间的接近程度呢？可使用以下常用统计量进行衡量。各统计量分解如下：

SST总平方和
SSR回归平方和
SSE残差平方和

回归平方和是回归值与均值的离差平方和，可以看做由于自变量回归分析-常用统计量含义解析的变化引起的的变化（即受的影响）；

残差平方和（或称误差平方和）是真实值与回归值的离差平方和，它是除了回归分析-常用统计量含义解析对的线性影响之外的其他因素引起的的变化部分，是不能由回归直线来解释的的变差部分（即受其他因素的影响，如对的非线性影响、测量误差等）。残差平方和描述了真实值与预测值之间的差异程度。

三个平方和的关系为：

总平方和（SST）= 回归平方和（SSR）+ 残差平方和（SSE）

判定系数

判定系数是对估计的回归方程拟合优度的度量。（即测度了回归直线对观测数据的拟合程度）

若所有观测点都落在回归直线上，残差平方和SSE=0，则=1，拟合是完全的；
如果的变化与无关，完全无助于解释的变差，，则=0；
的取值范围是[0, 1];
越接近1，表明回归平方和占总平方和的比例越大，回归直线与各观测点越接近，用的变化来解释值变差的部分就越多，回归直线的拟合程度就越好；反之，越接近0，回归直线的拟合程度就越差。

例子解释其含义：

下图为不良贷款Y对贷款余额X构建的一元线性回归模型的回归分析结果，数据源可查看https://blog.****.net/qq_39284106/article/details/104156844

回归分析-常用统计量含义解析

Q：计算不良贷款回归分析-常用统计量含义解析对贷款余额回归的判定系数，并解释其意义？

A1：回归分析-常用统计量含义解析

A2：判定系数的实际意义是：在不良贷款取值的变差中，有71.16%可以由不良贷款与贷款余额之间的线性关系来解释，或者说，在不良贷款取值的变动中，有71.16%是由贷款余额所决定的。不良贷款取值的差异有2/3以上是由贷款余额决定的，可见二者之间有较强的线性关系。

调整的判定系数Adjusted_R_square

调整的判定系数是用样本量回归分析-常用统计量含义解析和自变量的个数去调整的，其实际意义是在用样本量和模型中自变量个数进行调整后，能被因变量和自变量的一元或是多元回归方程所解释的比例为。

有了判定系数，为什么还需要调整的判定系数呢？

：是因为自变量个数的增加将影响到因变量的变差中被估计的回归方程所解释的比例。当增加自变量时，会使预测误差变得较小，从而减少残差平方和SSE。由于回归平方和 SSR=SST - SSE,当SSE变小时，SSR就会变大，从而使回归分析-常用统计量含义解析变大。如果模型中增加一个自变量，即使这个自变量在统计上并不显著，也会变大。因此避免增加自变量而高估，需要同时考虑样本量和模型中自变量的个数的影响，这就使得的值永远小于，而且的值不会由于模型中的自变量个数增加而越来越接近1。因此在多元回归分析中，通常用调整的判定系数。

Q：计算不良贷款回归分析-常用统计量含义解析对贷款余额回归的调整的判定系数，并解释其意义？

A1：回归分析-常用统计量含义解析