接下来做什么以及评估假设

 以房屋价格为例子我们来说明误差的问题,假如我们用之前学习的算法来进行房屋价格的预测,但是预测结果和我们实际的结果相差很大,接下来我们应该做什么呢?

 1、我们可能尝试着去获取更多的训练集,认为只要获取两倍甚至10倍的训练集就可以得到准确的结果

 2、我们尝试着去减少特征的个数,从而避免过拟合的结果

 3、增加特征的个数

 4、我们也可能会尝试增加多项式特征的方法,比如x1的平方、x2的平方

 5、减小正则化参数

 6、增加正则化参数

 

接下来做什么以及评估假设

 以上的5种方法,我们可能只是随便的选择一种去实现,但是可能最后花费了几个月的时间,最后的结果还是有很大的误差。

这是我们就应该使用机器学习诊断算法,从中找出导致出现误差的原因,然后在对症下药。

接下来做什么以及评估假设

评估假设

 

我们将我们的训练集分为两个部分:训练部分(70%)和检测部分(30%)

接下来做什么以及评估假设

线性回归的情况:

接下来做什么以及评估假设

逻辑回归的情况:

接下来做什么以及评估假设