【Machine Learning notes(机器学习笔记-001)】

coursera: 
【1】https://www.coursera.org/learn/machine-learning/home/welcome
【2】http://cs229.stanford.edu/

【3】http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html


1)机器学习定义

机器学习的定义 
Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. 
Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.


2)本节课程学习重点:

机器学习的动机与应用;Logistics类;机器学习的定义;监督学习概述;学习理论概述;非监督学习概述;强化学习概述

本课内容主要分为四个部分:Supervised Learning(监督学习)、Learning Theory(学习理论)、Unsupervised Learning(非监督式学习)、Reinforcement Learning(强化学习)


3)监督学习(Supervised Learning) 
之所以被称为”监督学习”,是因为我们在“监督”问题的算法,换句话说,会给出一组“标准答案”。 
下面给出两个监督学习的实例。 
首先是一个房子价格预测的例子,收集的部分数据集如下: 
【Machine Learning notes(机器学习笔记-001)】

通过上面的数据集,可以绘出一个图,横坐标是占地面积,纵坐标是价格,根据这些数据,可以根据不同的方法拟合出不同的直线。

【Machine Learning notes(机器学习笔记-001)】

然后可以根据一直的房子占地大小,来预测房屋的价格。

下面是一个分类的问题,根据肿瘤的大小来预测乳腺癌的良性或劣性。 
【Machine Learning notes(机器学习笔记-001)】 
说明:“X”表示肿瘤为良性,“O”表示肿瘤为劣性。 
【Machine Learning notes(机器学习笔记-001)】 
表示不同年龄的人和不同肿瘤大小组成的数据,“X”表示肿瘤为良性,“O”表示肿瘤为劣性。可以通过一个算法将其分成两类。

这只是一个线性二维的问题,如果有多维数据呢?后面说的SVM(支持向量机)就可以用来处理高维数据。


4 )非监督学习(UnSupervised Learning)

首先看看下面这个图 
【Machine Learning notes(机器学习笔记-001)】

非监督学习事实上就是聚类,将许多的数据或是杂乱无章划分成相似的多个类别。

例如:将鸡尾酒会上混乱无章的多种声音区分出来。


5)Reinforcement Learning(强化学习)

是一种评价式的学习方式,基于回报函数。


参考:http://blog.csdn.net/Dream_angel_Z/article/details/45932185