【机器学习】西瓜书-第2章模型评估与选择
评估方法
交叉验证
从“偏差-方差分解”去解释model的泛化性能
- 这个model为什么具有如此性能呢?——那么就要从“偏差-方差分解”去解释model的泛化性能。(考过)
偏差-方差分解试图对model的期望泛化错误率进行拆解。泛化误差可以分解为偏差、方差、与噪声之和。
偏差度量了:pred与gt的差别,即刻画了model本身的拟合能力;
方差度量了:trainset样本内容不同但是样本大小相同所导致的学习性能的变化,即刻画了数据扰动所造成的影响;
噪声表达了:在当前任务上任何学习算法model所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度。
偏差-方差分解说明,model的泛化性能是由学习算法的能力、数据的充分性、学习任务本身的难度所公共决定的。
给定学习任务,为了取得好的泛化性能,则需使得偏差较小,即能够充分拟合数据,并使方差较小,即使得数据扰动产生的影响小。