清风数学建模--一元线性回归

一元线性回归模型

xy线yi=β0+β1xi+μiβ0β1μiyi^=β0^+βi^xiβ0^,β1^=arg min(i=1n(yiyi^)2)=arg min(i=1n(yiβ0^βi^xi)2)β0^,β1^=arg min(i=1n(mui^)2)μi^=yiβ0^βi^xi假设x是自变量,y是因变量,且满足如下线性关系\\y_i=\beta_0+\beta_1x_i+\mu_i\\\beta_0和\beta_1为回归系数,\mu_i为无法观测地且满足一定条件地扰动项\\令预测值\hat{y_i}=\hat{\beta_0}+\hat{\beta_i}x_i\\其中\hat{\beta_0},\hat{\beta_1}=\argmin(\sum_{i=1}^n(y_i-\hat{y_i})^2)=\argmin(\sum_{i=1}^n(y_i-\hat{\beta_0}-\hat{\beta_i}x_i)^2)\\\hat{\beta_0},\hat{\beta_1}=\argmin(\sum_{i=1}^n(\hat{mu_i})^2)\\我们称\hat{\mu_i}=y_i-\hat{\beta_0}-\hat{\beta_i}xi为残差

对于线性地理解

xy线:yi=β0+β1xi+μi假设x是自变量,y是因变量,且满足如下线性关系:\\y_i=\beta_0+\beta_1x_i+\mu_i

线线,线线性假定并不要求初始模型都呈上述地严格线性关系,\\自变量与因变量可以通过变量变换儿转化称线性模型
清风数学建模--一元线性回归

回归系数地解释

清风数学建模--一元线性回归
从图中可以看出,由于多加入了一个变量x2x_2导致x1x_1前面的系数变化很大,而这是由内生性导致的。

内生性

Y=β0+β1x1+β2x2++βkxk+μμmux假设我们的模型为:Y=\beta_0+\beta_1x_1+\beta_2x_2+\cdots+\beta_kx_k+\mu\\ \mu为无法观测满足的且满足一定条件的扰动项\\如果满足误差项\\mu和所有的自变量x均不相关,测称该回归模型具有外生性\\(如果相关,则存在内生性,内生性会导致回归系数估计不准确,不满足无偏和一致性)

:μi回到刚才的例子中:误差项\mu_i包含了什么

包含了多有与yy相关,但未添加到回归模型中的变量,而如果这些变量和我们已经添加的自变量相关,则存在内生性

核心解释变量和控制变量

 因为五内生性要求所有的解释变量均与扰动项不相关。而这个假定通常太强了,因为解释变量一般很多,且需要保证它们全部外生。
 而我们可以通过将解释变量分为核心解释变量与控制变量两类
核心解释变量:我们最感兴趣的变量,因此我们特别希望的到对其系数一致估计(当样本容量无限增大时,收敛于待估计参数的真值)。
控制变量:我们可能对于这些变量并无太大的兴趣;而之所以把它们也放入回归方程,主要是为了“控制住”那些对被解释变量有影响的遗漏因素。
在实际应用中,我们只要保证核心解释变量与u不相关即可