Machine Learning Course-CS 156 笔记 3

Lecture 3 : The Linear Model I

视频地址:https://www.youtube.com/watch?v=FIbVs5GbBlQ


输入形式

一个数据集:

Machine Learning Course-CS 156 笔记 3

每个数字尺寸是 16×16,也就是 256个值。

‘raw’ input X=(x0,x1,x2,...,x256)(x0=1)
linear model : (w0,w1,w2,...,w256)

特征 : 提取有用的信息。
例如强度和对称性:X=(x0,x1,x2)
此时 W=(w0,w1,w2)
x1是强度 , x2是对称性。下图是1和5的区别。

Machine Learning Course-CS 156 笔记 3


线性分类

PLA的应用:
- EinEout 的演化
Machine Learning Course-CS 156 笔记 3
- 最终的边界
Machine Learning Course-CS 156 笔记 3
- Pocket 算法
保存迭代过程中的最优解


线性回归

regression real-valued output

继续用银行信用举例
- 分类:是否有信用
- 回归:信用额度

Input: x

年龄 性别 年薪 定居时间 债务
23岁 $30000 1年 $15000

Output:

(26)h(x)=i=0dwixi=WTX

数据集: (x1,y1),(x2,y2),...,(xN,yN)

误差函数: 利用 (h(x)f(x))2

(27)Ein(h)=1Nn=1N(h(x)f(x))2

Ein 的表示:

(28)Ein(W)=1Nn=1N(WTxnyn)2=1N||XWY||2

其中
(29)X=[x1Tx2TxNT],Y=[y1y2yN]

最小化 Ein

(30)Ein(W)=2NXT(XWY)=0XTXW=XTYW=XY,X=(XTX)1XT

XX(X)

关于伪逆矩阵
https://en.wikipedia.org/wiki/Generalized_inverse
https://en.wikipedia.org/wiki/Moore%E2%80%93Penrose_inverse

线性回归算法:
1.构建 X 矩阵和 Y 矩阵
2.计算伪逆矩阵 X=(XTX)1XT
3.返回 W=XY

线性回归也可以用于分类


非线性变换

线性是受限的,比如:

Machine Learning Course-CS 156 笔记 3

在银行信用额度示例里,居住年限是非线性影响额度的

(x1,x2)Φ(x12,x22) 上图变为:
Machine Learning Course-CS 156 笔记 3