线性回归---7.欠拟合和过拟合
定义:
过拟合:
训练集表现好,测试集表现不好
欠拟合:
训练集,测试集表现都不好
原因及解决办法:
欠拟合:
特征过少
解决办法:
添加其他特征项
添加多项式特征
过拟合:
特征过多,嘈杂特征,尝试兼顾太多
解决办法:
重新清洗数据
增大数据的训练量
正则化
减少特征维度,防止维灾难
正则化
定义:
在学习的时候,数据提供的特征有些影响模型复杂度或者这个特征的数据的异常点较多,所以在学习的时候尽量减少这个特征的影响,甚至删除,这就是正则化
维灾难