第六周(机器学习应用建议)-【机器学习-Coursera Machine Learning-吴恩达】
目录
评估学习算法:
方差和偏差
学习曲线
·利用 训练集 优化参数 theta
·使用 验证集 找到最小误差的多项式
欠拟合:高偏差
过拟合:高方差

2)绘制学习曲线
有时候绘制学习曲线方便进一步优化模型
模型评估
误差度量
评估学习算法:
方差和偏差
学习曲线
机器学习系统设计
1 评估假设,选择多项式模型
利用 测试集误差。线性回归:
逻辑回归:
当选择多项式模型时:
一般进一步划分数据集为训练集60%、验证集20%、测试集20%·利用 训练集 优化参数 theta
·使用 验证集 找到最小误差的多项式
·使用 测试集 估计泛化误差
2 偏差和方差:如何评价一个学习算法
1)拟合与偏差/方差欠拟合:高偏差
过拟合:高方差
2)绘制学习曲线
有时候绘制学习曲线方便进一步优化模型
高偏差(欠拟合):
高方差(过拟合):
3)改进措施
3 机器学习系统设计
构建一个简单的系统,然后利用 算法评估、误差度量值,改进系统模型评估
误差度量
查准率和召回率
权衡 P和R: