【Python与机器学习 4-1】 机器学习基本概念和流程

机器学习基本概念

机器学习可以通过有无标签划分为监督学习和非监督学习
最后要预测什么什么就是标签

  • 监督学习:学习的是带有标记的数据
  • 非监督学习:学习的是未被标记的数据

机器学习问题的表示

1.根据n个独立同分布观测样本确定预测函数
独立同分布是机器学习的前提,同分布是指数据的分布是相同的,独立是指数据之间相互不影响。但是实际的数据中有很多不符合独立同分布,比如视频。
2.在一组函数{f(x,w)}中求一个最优的函数f(x,w0)对依赖关系进行估计,使期望风险最小

机器学习基本流程

【Python与机器学习 4-1】 机器学习基本概念和流程

  • representation 特征表示
    对数据进行处理,根据属性构造特征。
    把数据表示成模型可以接收的格式
  • evaluation 检验
    每个模型有许多参数,根据上一步的历史数据调整参数
  • optimization 优化
    得到最优化的参数,得到模型
    【Python与机器学习 4-1】 机器学习基本概念和流程

基本框架

【Python与机器学习 4-1】 机器学习基本概念和流程

  • 定义一系列函数
    给一个同一个机器学习模型的具有不同参数的函数
  • 定义函数优劣
    制定评价模型的好坏标准
  • 选择最优的函数
    根据制定的标准和训练集找到最好的函数