北京二手房价格预测模型【业务向】2020.8
北京二手房价格预测模型【业务向】2020.8
研究背景
疫情对大部分产业都产生了较大的冲击,但是疫情得到控制后北京的楼市也开始回温,二手房市场开始稳步回暖,本次项目的研究目的就是对复工后当前二手房市场的情况进行分析,分析影响二手房价格的影响因素,构建合适的房价预测模型为二手房价格评估提供决策支持
数据来源:爬取北京二手房相关信息,截止时间2020.08。
二手房价格影响因素探索
1.指标概述
2.北京各地区二手房价格分布
- 二手房市场价格高的区,房源量也相对充足。
- 各区房源中怀柔的房价最高且房源量较少,这部分房源大都是“郊区别墅”类型,周围环境优美适合度假。
- 海淀、朝阳东城西城的房价稳居前列,且房源充足。 西城这块教育资源充足,是作为学区房的首选,海淀,朝阳是经纪发展的重心。
- 由于7月份北京出台学区房相关政策,西城的学区房价格波动较大,且房价稳榜首。
3.楼层及朝向对二手房价格的影响
- 地下室的价格显示的最高,经查证大多是地下商场这样的房源,所以在价格和均价上也是相对比较高,不过这部分房源量相对较小,且大部分分布在东城和西城地区。
- 楼层越高,其价格反而相对会低一些,同时高层的房源数量相对较多。
- 朝东的房子均价最高,朝北则最低,均价相差达到了100万左右。
4.楼型对北京二手房价格的影响
- **板楼的房源数量是最多的,价格却是最优惠的,**且板楼的通透性好,便于采光,公摊面积小,适合预算较低的客户考虑入手。
- 对于北京地区而言平房的价格是最高的,且房源量稀少,这类房源大多是北京的四合院,在寸土寸金的北京能够成交的房源本身就较为少,且大多都是有传承历史的,这也使得平房价格高居不下。
- 塔楼的价格是仅次于平房的,且房源量适中,塔楼改造灵活,且抗震性很好。预算充足的客户可以考虑入手。
- 暂无数据的房源其平均价格也很高,需要具体求证缺失的原因再另行分析(如:别墅的房型不是很好区分楼型是否会选择选择暂无)
5.装修情况对北京二手房价格的影响
- 房源量以及房源的平均单价都是跟着装修情况相关的,精装的房源最充足,且价格相对较高。
- 毛坯房的房源量相对较少,且价格相比简装每平可以降低6千左右,预算较低的客户可以考虑入手这款的房子。
- 其中装修情况为“其他”的房子有40%的房子都是在远离地铁的,且这部分的房子面积相对较大,价格也相对较低
6.面积对北京二手房价格的影响
- 根据左图可知,除了特殊值之外,二手房总价分布大都在随着面积的增长而升高。
- 整体来说地铁附近的房价会相对更高一些,同等面积其价格上涨空间会相对更大。
- “天价房”大多是远离地铁的房子,且房源数量叫少。–“郊区别墅”和“四合院”这种。
7.建筑时间对价格的影响
- 总体来看北京65年以上的老房子和近5年修建的房子均价最高,且相对数量较少。
- 房子建筑时间在16年左右的房源数据量是最多的,且价格适中,选择空间会比较大。
8.地铁对房子均价的影响
- 根据是否临近地铁可以看出,靠近地铁的房源相对价格会高一些。
- “天价房”大多都是出现在远离地铁的一些“别墅”或者“老四合院”。
- 整体来说地铁附近的房价会相对更高,与实际情况相符。
二手房价格评估
根据Python构建决策树、随机森林等模型后选取了预测效果最好的随机森林模型。(因为随机森林更加适合)
1.房价主要影响因素
- 根据上诉结果可以看出,对二手房价格影响最大的是面积,其次是所在区和建筑时间。
- 楼型和是否临近地铁的这两类指标,对房价也是有一些影响的。
- 客厅数的多少对总价的影响相对比较小。
2.场景预测
------------禁止转载------------