清风数学建模--多元线性回归分析1
回归的思想
回归分析:研究x和y之间相关性的分析
三个关键词:
- 相关性
- X
- Y
相关性
绝大多数的情况下,我们没有能力去探究严格的因果关系,因此只好退而求其次,改成通过回归分析,研究相关关系
Y
Y是因变量。实际应用中,Y常常是我们需要研究的那个核心变量。
X
x是用来解释Y的相关变量,所以x被称为自变量。
回归分析的任务就是,通过研究x和y的相关关系,尝试去解释Y的形成机制,进而达到通过x去预测y的目的。
回归分析的使命
-
使命1:识别重要的变量
回归分析要去识别并且判断:**哪些x变量是同Y真的相关,哪些不是。**统计学中有非常重要的领域,叫做“变量选择”(逐步回归) -
使命2:判断相关性的方向
去除掉了那些同Y不相关的x变量,那么剩下的都是重要的、有用的x变量了。接下来回归分析要回答的问题是:这些有用的x变量同Y的相关系数是正还是负? -
使命3:要估计权重(回归系数)
在确定了重要的x的变量的前提下,我们还想赋予不同x不同的权重,也就是不同的回归系数,进而我们可以知道不同变量之间的相对重要性。
回归的分类
数据的分类
- 其中,在数学建模的比赛中前两种数据类型最常靠到;
- 面板数据较为复杂,是经管类学生在中级计量经济学才会学到的模型
- 横截面数据往往可以使用回归来进行建模,我们通过回归可以得到自变量与因变量之间的相关关系以及自变量的重要程度
- 时间序列数据往往需要我们进行预测。模型的选择也多
数据的收集
【简道云汇总】110+数据网站.
虫部落数据搜索.
【汇总】数据来源/大数据平台.
大数据工具导航工具.
数据平台.
上面的数据多半是宏观数据,微观数据市面上很少
可以在人大经济论坛搜索
人大经济论坛.
或者自己学习爬虫
傻瓜式软件爬取(八爪鱼).