【机器学习】西瓜书-第2章模型评估与选择

评估方法

交叉验证

【机器学习】西瓜书-第2章模型评估与选择

 

从“偏差-方差分解”去解释model的泛化性能

  • 这个model为什么具有如此性能呢?——那么就要从“偏差-方差分解”去解释model的泛化性能。(考过)

偏差-方差分解试图对model的期望泛化错误率进行拆解。泛化误差可以分解为偏差、方差、与噪声之和。

偏差度量了:pred与gt的差别,即刻画了model本身的拟合能力;

方差度量了:trainset样本内容不同但是样本大小相同所导致的学习性能的变化,即刻画了数据扰动所造成的影响;

噪声表达了:在当前任务上任何学习算法model所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度。

偏差-方差分解说明,model的泛化性能是由学习算法的能力、数据的充分性、学习任务本身的难度所公共决定的。

给定学习任务,为了取得好的泛化性能,则需使得偏差较小,即能够充分拟合数据,并使方差较小,即使得数据扰动产生的影响小。

【机器学习】西瓜书-第2章模型评估与选择

【机器学习】西瓜书-第2章模型评估与选择