您的位置: 首页 > 文章 > 【机器学习】西瓜书-第2章模型评估与选择

【机器学习】西瓜书-第2章模型评估与选择

分类: 文章 • 2024-12-29 09:35:04

评估方法

交叉验证

【机器学习】西瓜书-第2章模型评估与选择

从“偏差-方差分解”去解释model的泛化性能

这个model为什么具有如此性能呢？——那么就要从“偏差-方差分解”去解释model的泛化性能。（考过）

偏差-方差分解试图对model的期望泛化错误率进行拆解。泛化误差可以分解为偏差、方差、与噪声之和。

偏差度量了：pred与gt的差别，即刻画了model本身的拟合能力；

方差度量了：trainset样本内容不同但是样本大小相同所导致的学习性能的变化，即刻画了数据扰动所造成的影响；

噪声表达了：在当前任务上任何学习算法model所能达到的期望泛化误差的下界，即刻画了学习问题本身的难度。

偏差-方差分解说明，model的泛化性能是由学习算法的能力、数据的充分性、学习任务本身的难度所公共决定的。

给定学习任务，为了取得好的泛化性能，则需使得偏差较小，即能够充分拟合数据，并使方差较小，即使得数据扰动产生的影响小。

【机器学习】西瓜书-第2章模型评估与选择

【机器学习】西瓜书-第2章模型评估与选择