第二章-机器学习基本概念

机器学习基本概念

假设空间

  • 所有模型的集合称为假设空间
  • 与训练集一致的假设集合,我们称为版本空间第二章-机器学习基本概念

学习方法三要素

第二章-机器学习基本概念第二章-机器学习基本概念
第二章-机器学习基本概念

  • 损失函数是模型一次预测的好坏。
  • 风险函数是平均意义上模型预测的好坏。
    第二章-机器学习基本概念
    第二章-机器学习基本概念

训练误差和测试误差

  • 当损失函数是0-1损失时,测试误差+测试准确率=1
    第二章-机器学习基本概念

过拟合和模型选择

给一个例子具体说明过拟合,在经验风险最小时,看W的取值(参数的个数)
第二章-机器学习基本概念
M不同,拟合曲线不同,可以看出M=9时,拟合最好
第二章-机器学习基本概念
下图是训练和测试误差,虽然M=9时,训练误差最小,但是测试误差很大。这就是过拟合现象:学习时选择的模型过于复杂,或者包含的参数太多,以至于这个模型对已知的数据预测的很好,对未知数据预测的很差这一现象。
第二章-机器学习基本概念
训练误差和测试误差与模型复杂度的关系图
第二章-机器学习基本概念
当模型较复杂时,我可以增加训练样本集大小的方式去减少泛化误差。
针对减小泛化误差另外一种方法就是正则化。
第二章-机器学习基本概念
当M=9时,加入正则化项后,模型性能变化。
第二章-机器学习基本概念
正则化项增大,如右边为0,会使参数受到更大的抑制,从而模型变得更加简单。
第二章-机器学习基本概念

泛化能力

模型泛化能力是指,由该方法学习到的模型,对未知数据预测的能力。
主要通过测试误差来评价,但是测试数据的有限和不同,使得评价不是很可靠。
泛化能力是通过研究泛化误差的上届进行的,
第二章-机器学习基本概念
第二章-机器学习基本概念

生成模型和判别模型

监督学习方法分为生成方法和判别方法,对应生成模型和判别模型。
生成模型:模型为决策函数或条件概率分布,由数据学习联合概率分布,然后求出条件概率。
判别模型:直接求取决策函数,或条件概率分布。
第二章-机器学习基本概念
第二章-机器学习基本概念