AI入门之机器学习(1)
机器学习
-
机器学习:从数据中学习,通过算法对新的数据作出识别或者预测
-
通过已知的数据找到模型的过程叫做拟合(即机器通过数据学习的过程)
-
-
机器学习学习过程:
4.1:建立模型(y=wx+b)
4.2:学习模型(确定w和b的值)
4.3:预测和识别(使用得到的模型进行预测和识别)
5.学习算法:从数据中产生模型的算法(如下2点解释)
5.1:经典程序设计是:已知规则和数据(x、w、b已知),求解答案(y)
5.2:机器学习算法是:已知答案和数据(y、x),求解规则(w、b)
- 机器学习是通过学习算法从数据中学习模型的过程
- 在机器学习中数据的集合被称为:数据集或者样本集,数据集中的每一条记录被称为样本
8.样本由属性(或者特征)+标记(或者标检)组成
_____________________________________________________________________
监督学习:可分为1.回归(预测连续值,比如预测房屋的价格)2.分类(预测离散值,比如手写数字的识别)
无监督学习:在样本数据没有标记的情况下,挖掘出数据内部蕴含的关系
聚类:把相似度高的样本聚合在一起(样本需要标记)
距离:描述了特征值之间的相似度
半监督学习:将有监督学习和无监督学习相结合,综合使用大量的没有标记的数据和少量有标记的数据共同进行学习
总结:机器学习能从数据中抽取出大量有价值的信息,发现数据背后的规律,从而实现大规模的数据识别、分类、预测。