2020-10-19 群体感知 -确保数据可行性
引言
尽管我们可以通过一系列的激励方法和信用机制来保证更多的用户参与群体感知,保证提供数据的可靠性,但是,由于多种因素的影响,停车位信息的提供依然无法十分准确。依然会存在用户根据系统提供的车位信息到达目的地之后无法停车的情况。这种情况没有办法杜绝,但可以通过一些方法来降低发生的概率。如使用机器学习的方法对于停车位空闲信息进行预测,如利用推荐算法模型综合多种因素进行推荐。
车位预测
预测系统
预测系统的基本思想是,将采集的大量数据(X,Y)经过学习系统,得到模型。这样对于其他的测试x,就可根据模型得到其对应的y,达到预测的目的。
机器学习三要素:
模型是我们要得到的目标函数,是总结数据的内在规律,用函数来描述的系统。策略是选取最优模型的评价准则,是预测值和真实值之间的差距。算法是选取最优模型的具体方法,也即求得更加靠近真实值的模型的方法。
以线性回归为例
模型:
策略(损失函数):均方误差
算法:最小二乘法,梯度下降法
最小二乘法:
梯度下降法:
目的:梯度下降(gradient descent)在机器学习中应用十分的广泛,不论是在线性回归还是Logistic回归中,它的主要目的是通过迭代找到目标函数的最小值,或者收敛到最小值。
梯度的方向是函数在给定点上升最快的方向,那么梯度的反方向就是函数在给定点下降最快的方向,这正是我们所需要的。所以我们只要沿着梯度的方向一直走,让函数的未知数随着梯度的方向运动,就能走到局部的最低点!
以线性回归为例
回归模型:
损失函数为均方误差损失函数
损失函数:
明确一下,未知数不是x,而是Θ,通过迭代Θ,达到损失函数的最小值。
迭代公式:
文献举例
利用基于时间的预测方法来预测车位的饱和度
1.获取原始图片数据,经过图像处理,得到初始数据字段,及初始车位饱和度预测值X1
2.由大量基于时间的采集历史数据,获得非线性时间预测模型,得到基于事件的饱和度预测值X2
3.为了提高预测的精准度,结合由用户采集的信息进一步预测,得到最终预测值,其中X1为初始预测值,X2为基于时间的饱和度预测值,X3为采集空车位数量
停车位推荐模型
通过综合考虑多种影响停车位选择的因素,建立停车行为选择模型,从而为用户提供更为理想的车位。
综合这些影响停车位选择行为的因素,得到推荐模型
其中w值,由遗传算法得到。