机器学习白到反光的小白——前言

学习笔记,如果有错误求指出,但是小白就不要看了容易误导泥萌(/ω\)

一、什么是机器学习

机器学习是实现人工智能的一种手段,我们为机器编写学习程序,使得机器可以自主学习。

在这里,我们将机器看成一个人,所有所学的知识和做出的行为,都是先天学习和后天学习共同形成的。对于机器而言,先天学习是人类设定的大量规则,后天学习则是机器学习主要致力实现的部分。每一个机器起初都是一个小baby,在社会教育和自主学习的过程中长大成人。

而机器”学习”的过程,就是在大量数据下找到一个抽象意义上的 函数f,完成从 f(已有数据)= 想得到的结果 的映射。

二、机器学习的架构

那么问题来了,机器学习需要我们做些什么呢?

  1. 定义函数f的集合{ f1,f2,f3……无穷 }
  2. 用大量数据训练上述集合中的函数,判断fi是否输出正确
  3. 挑选出最为准确的f

之后便是对这个最为准确的f进行测试,看是否这个函数真的让人满意。

三、实现方案

1. Supervised Learning(监督学习)

顾名思义,监督学习是指在有人监督指导下的学习。

程序员利用一组已知类别的样本进行试验,调整分类参数,使机器达到所要求的性能。

举一个简单的例子:我们将一部分猫、狗、蛇的图片给机器,教会他认识这些动物;当拿不同的猫的图片给机器时,希望他能认出这是猫;而结果可能是机器没有认出这是猫,此时我们就要调整分类参数,使它更好的对图片进行分类。

在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。

相关概念:

  • classfication(分类):在监督学习的过程中,机器根据已有类别将输入对象进行分类,并打上相应的标签。分类分为二元分类和多元分类两种,二元分类只有两种标签,如:你吃饭了吗?回答有是和否两种选择。多元分类有多种标签,如:明天天气如何?有晴天、阴天、下雨、下雪等不同选择。
  • Regression(回归):回归是分类的一种工具,回归是根据样本研究其两个(或多个)变量之间的依存关系,是对于其趋势的一个分析预测。
  • label(标签):函数 f 的输出。
2. Semi-Supervised Learning (半监督学习)

半监督学习与监督学习不同的地方在于:它在使用大量有标记数据的同时,也会使用大量的未标记数据

当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性。

3. Transfer Learning(迁移学习)

在迁移学习中,有着大量有标记的数据,大量未标记的数据,以及不相干的数据,不相干的数据也会对学习有帮助。

4. Unsupervised Learning(无监督学习)

现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。

无监督学习即根据没有标记(没有分类)的样本解决模式识别中的各种问题。

在无监督学习中,每个实例只有输入对象而没有输出值

5. Structured Learning (结构化学习)

结构化学习是指函数的label是有结构的,例如是一句话而不是一个字。

6. Reinforcement Learning (强化学习)

强化学习类似于进入社会之后人的学习,没有人告诉你什么是对的什么是错的,需要你自己实践之后才能知道。

机器也是一样,它不知道正确答案是什么,只知道这次这样做是对或是错,从错误中不断完善自己。

机器学习白到反光的小白——前言