机器学习一——分类
一:机器学习分类一(根据不同的用途)
1.监督学习:
(1)分类:label 是离散的
(2)回归:label(在这里说预测值更合适,比如房价,无人驾驶中方向盘转动的角度) 是连续的
在一些情况下,可以将连续的预测值量化,从而将回归问题转化为分类问题。
2.非监督学习:
(1)对数据进行降维:
特征提取:
特征压缩:PCA,将关联度(相似性)高的特征变为一个。
如手写数字的识别,相邻的像素点灰度值近似,因此可用一个像素点代替周围的多个,从而减少特征数量,降低维度
数据降维的意义:数据可视化。如把高维降到二维,三维,方便作图,将数据的具体分布等展现出来,使人们更好的理解。
(2)异常检测
3.半监督学习
实际中,可能有些样本的标签值(也可以表示回归中的预测值)丢失,有些样本有标签,有些没有标签,则称之为半监督学习。
半监督学习的方法:一般先用非监督学习手段对数据做处理,之后使用监督学习的手段做模型的训练和预测。
二,机器学习分类二(根据是否能适应环境的变化)
1.批量学习:
(1)定义:批量学习是指用一批数据将模型训练完成后,训练数据就被丢弃。在实际环境中输入样本,预测样本,模型不再更新。
(2)如何和适应环境的变化?
定时重新批量学习,但计算量大,某些业务可能需要频繁的重新批量学习。
2.在线学习;
(1)定义:
能及时反映新的数据变化,也适用于数据量大,无法完全批量学习的环境。
(2)新的(异常)数据带来不好的影响怎么办?
加强对数据进行异常监控(用到非监督学习中的异常监测功能)
三。机器学习分类三(根据参数进行划分)
1.参数学习
如先假设:f(x)=ax+b,根据点的坐标(样本),训练,学习得到参数a,b的值
2,非参数学习(对这个还不是特别理解,后续更新)
不对其进行过多的假设,但不代表没有参数。