模型误差的来源分析bias VS variance
如题,其中,bias是期望输出与真实标记的差别。记为:
该值描述的是学习算法的期望预测与真实结果的偏离程度,即刻画了算法本身的拟合能力。
variance是使用样本数相同的不同训练集产生的方差。记为:
该值描述的是同样大小的训练集的变动所导致的学习性能的变化,即刻画了数据扰动所造成的影响。
总结起来就是,模型简单,数据欠拟合,误差主要来源是bias;模型越复杂,数据过拟合,误差主要来源是variance。下图可以很好的表示总结的内容(详情可以点击观看视频)。
bias大的直观表现以及解决方法:
variance大的直观表现以及解决方法:
如何训练模型: