接下来做什么以及评估假设
以房屋价格为例子我们来说明误差的问题,假如我们用之前学习的算法来进行房屋价格的预测,但是预测结果和我们实际的结果相差很大,接下来我们应该做什么呢?
1、我们可能尝试着去获取更多的训练集,认为只要获取两倍甚至10倍的训练集就可以得到准确的结果
2、我们尝试着去减少特征的个数,从而避免过拟合的结果
3、增加特征的个数
4、我们也可能会尝试增加多项式特征的方法,比如x1的平方、x2的平方
5、减小正则化参数
6、增加正则化参数
以上的5种方法,我们可能只是随便的选择一种去实现,但是可能最后花费了几个月的时间,最后的结果还是有很大的误差。
这是我们就应该使用机器学习诊断算法,从中找出导致出现误差的原因,然后在对症下药。
评估假设
我们将我们的训练集分为两个部分:训练部分(70%)和检测部分(30%)
线性回归的情况:
逻辑回归的情况: