图解机器学习
1、人工智能、机器学习、深度学习关系
人工智能是一个范围很广的词,他可以表达很多不同的事物。与之相反,机器学习指某些特定的领域,当然机器学习本身包括很多技术,其中之一就是是深度学习。
2、建立机器学习的流程
3、机器学习的建模和预测流程
4、过拟合(处理方法:正则化和验证)
(1)待分类的数据点
(2)用简单边界曲线分类后的数据点 和 用复杂边界曲线分类后的数据点
*
复杂的模型曲线倾向于过拟合。相反简单的模型曲线虽然一些点上没有正确的分类,但是它更好的反映了这些数据的整体特点。
- 现在换个视角来看这组数据:数据中包含了太多的噪声,问题是没有任何办法能让机器学习辨别这一点,因为机器学习考虑左右的数据,甚至包括噪声,这样会产生一个不适用的模型(这种情况下应当是条曲线),如果认为训练数据的每一个元素都是正确的,并且以此去精确的拟合模型,那么将得到一个低泛化的模型,这就叫“过拟合”。
(3)正则化
(3)验证
交叉验证:阴影部分表示验证数据,是训练过程随机选择出来。
5、机器学习模型
6、监督学习常见的应用类型(分类和回归)
(1)分类
*
分类问题的训练数据
(2)回归(与分类相反,不判类别,而是估计出一个值)
回归问题的训练数据