吴恩达机器学习--如何通俗的理解监督学习与无监督学习的概念、区别及其应用

机器学习就是通过一大堆数据集训练一个电脑程序让他能够去更加准确地预测出下一次的结果。机器学习算法分为两大类,监督学习(Supervised learning)和非监督学习(Unsupervised learning)。

通俗的讲,监督学习可以理解为我们教机器如何做事情,而无监督学习更像是让机器自学,让机器学会自己做事情。

监督学习给定的数据集是有输入和输出数据的,即一开始就知道这些数据和他们的结果,比如下文提到的房价的例子,给定房子的大小,利用回归函数可以估算出房子的价格,而房子的价格(价格范围)是已知的;但是不同于监督学习,无监督学习开始只知道这些数据,并不知道他们会得出什么样的结果。无监督学习是只给定不知道数据结构的数据,通过学习模型找出数据结构,这利用的是数据间的内在关系,比如聚类分析中的例子,谷歌新闻将各个报刊针对同一件事情的报道划分为一类。

1、监督学习

  在监督学习中,我们会知道一些数据集(输入),并且知道他们的答案(输出),其中输入输出的关系就是监督学习想要得到的结果。监督学习又分为两类,「回归问题」和「分类问题」。
  「回归问题」是什么呢?举个例子来说,现在我想预测一下房价,已经知道了一些房子的大小和价格,通过这些数据来拟合一个函数,然后把我家房子的大小输入到这个函数中,这个过程就是解决「回归问题」的过程。
吴恩达机器学习--如何通俗的理解监督学习与无监督学习的概念、区别及其应用
  「分类问题」呢?我现在看一下我的邮箱,里面有垃圾邮件和非垃圾邮件(这就是数据集),通过这些数据,我来拟合一个函数,判断我下一次收到的邮件是否为垃圾邮件。判断一封邮件是否为垃圾邮件的过程就是解决「分类问题」的过程。

吴恩达机器学习--如何通俗的理解监督学习与无监督学习的概念、区别及其应用

2.无监督学习

  在一堆数据集中,通过他们内在的关系将他们划分成几类。
  对于平时的考试来说,监督学习相当于我们做了很多题目都知道它的标准答案,所以在学习的过程中,我们可以通过对照答案,来分析问题找出方法,下一次在面对没有答案的问题时,往往也可以正确地解决。 而无监督学习,是我们不知道任何的答案,也不知道自己做得对不对,但是做题的过程中,就算不知道答案,我们还是可以大致的将语文,数学,英语这些题目分开,因为这些问题内在还是具有一定的联系。
  如下图所示,在无监督学习中,我们只是给定了一组数据,我们的目标是发现这组数据中的特殊结构。例如我们使用无监督学习算法会将这组数据分成两个不同的簇,,这样的算法就叫聚类算法。
吴恩达机器学习--如何通俗的理解监督学习与无监督学习的概念、区别及其应用
实际应用
1.Google新闻按照内容结构的不同分成财经,娱乐,体育等不同的标签,这就是无监督学习中的聚类。

2.市场分割:将客户分类,找出细分市场,从而更有效的进行销售

以上内容总结自:吴恩达机器学习课程