吴恩达机器学习第一章学习笔记

1.机器学习

在有性能度量值(performance measure)的情况下,为了解决特定的任务,程序从经验(程序成千上万次的运行)中学习,之后能更好的解决任务,这个过程可以称之为机器学习。

2.监督学习(supervised learning)

给监督学习算法一个已知输出的结果的数据集(并且数据具有标签(或者说属性),我们清楚地知道每个数据代表的含义),预测不在数据集中的数据的输出结果。
监督学习根据输出值是离散的还是连续的又可分为回归问题和分类问题。

2.1回归问题(regression problem)

程序预测连续输出的结果,这意味着程序试图将数据映射到某个连续函数,并预测一个连续值的输出。
例如,已知北京一个楼盘近些年的房价,预测未来几年的房价。
吴恩达机器学习第一章学习笔记

2.2分类问题(classification problem)

程序试图预测离散输出的结果。换句话说,程序试图将数据映射到离散的类别中。
例如,预测肿瘤是良性还是恶性。
吴恩达机器学习第一章学习笔记

3.无监督学习(unsupervised learning)

给无监督学习算法一个数据集(不知道输出结果的且没有标签或属性的一堆杂乱的数据(换句话说,我们并不知道数据集里的数据应代表什么意义))
吴恩达机器学习第一章学习笔记
虽然不知道数据之间的关系,但程序能从数据里推导出一定的结构

聚类算法

程序可以根据数据之间的关系对数据进行聚类,从而得到这种结构。
上图可以看作一个聚类算法。

鸡尾酒宴问题

这个其实也是聚类算法,只是数据集里的数据是声音,本质是对不同人的声音分类