机器学习-有监督学习(Supervised Learning)
定义:
有一组数量较多的历史样本集,其中每个样本有一组特征(Feature)和一个或几个表示其自身的类型或数值的标签(Label):对历史样本进行学习得到模型后,可用新样本的特征预测其对应的标签。
有监督学习与无监督学习的区别:
-
比喻:有监督学习是老师告诉你这个字母念A,然后下次你看到这个字母就知道读’A’了;而无监督学习是你给这个字母定义一个读音,能让你将这个字母与其他字母区别开。
根据标签的类型可将监督学习分为两个之类:
- 回归(Regression):标签是不可数的连续类型,有大小关系。
- 分类(Classification):标签是可数的离散类型。
策略和算法
- 人工神经网络
- 案例推论
- 决策树学习 最近邻居法 支持向量机 随机森林 学习自动机
应用
- 生物资讯学
- 化学资讯学
- 定量构效关系
- 手写辨识
- 资讯检索
- 电脑视觉中的物件识别
- 光学字元识别
- 侦测垃圾邮件
- 模式识别
- 语音识别
- 预测虚假财务报告