线性回归(假设检验)——学习笔记
为什么要做假设检验
在回归分析中,我们关心真实的参数是否是0或者说特定的数值。
由于数据抽样等等的情况,我们不可能获得最小二乘估计正好为0的情况。
那么非0的参数这个特征是由于x和y的相关关系产生的还是测量误差产生的
参数 统计量
多重检验问题
我们知道β均为0,但进行多次假设检验后都有可能得到一个显著的结果,因为每次假设检验都有一定概率犯错误(一类错误、二类错误)
这就是多重检验 问题 至今还没有比较好的解决方案。但有一些粗糙的方法
假设检验:F-检验
存在的问题是 举个例子:有50个解释变量,其中只有1个是相关的,因此在进行F检验的时候,F值会比较高,进而对每一个都进行t检验,但在剩余的49个无关变量中,依旧存在多重检验问题。
F检验的构造核心思想:
如果原假设是正确的 那么空模型的RSS和RSS1的差别很大,那么和X的关系较大;那么多大才是大呢?
重点在于和RSS1的无偏估计进行比较,即RSS1/自由度。
标准化!RSS0和RSS1的对比,空模型和全模型的对比。
如果 空模型和全模型的残差平方和差别不大,那么说明模型不显著。