【Python与机器学习 4-1】 机器学习基本概念和流程
机器学习基本概念
机器学习可以通过有无标签划分为监督学习和非监督学习
最后要预测什么什么就是标签
- 监督学习:学习的是带有标记的数据
- 非监督学习:学习的是未被标记的数据
机器学习问题的表示
1.根据n个独立同分布观测样本确定预测函数
独立同分布是机器学习的前提,同分布是指数据的分布是相同的,独立是指数据之间相互不影响。但是实际的数据中有很多不符合独立同分布,比如视频。
2.在一组函数{f(x,w)}中求一个最优的函数f(x,w0)对依赖关系进行估计,使期望风险最小
机器学习基本流程
- representation 特征表示
对数据进行处理,根据属性构造特征。
把数据表示成模型可以接收的格式 - evaluation 检验
每个模型有许多参数,根据上一步的历史数据调整参数 - optimization 优化
得到最优化的参数,得到模型
基本框架
- 定义一系列函数
给一个同一个机器学习模型的具有不同参数的函数 - 定义函数优劣
制定评价模型的好坏标准 - 选择最优的函数
根据制定的标准和训练集找到最好的函数