机器学习-Learning Deep Architectures for AI -1

随着计算机信息的发展,希望用计算机来model真实的物理过程，为了更精确地分析物理过程，计算机中关于物理过程的输入信息越多越好。让计算机储存/读取物理过程的所有信息是及其艰巨的，因此使用learning algorithm来不断学习获取物理过程的大部分有用信息。

人工智能方面，寻找合适的学习算法是最大的挑战。

我们假设为了表达复杂的物理过程,需要非常复杂的数学模型，例如高度非线性。面对非常复杂的问题时，很自然的想法即将复杂的原问题分解为多个子问题。以图像识别为例，从原始像素到人脸识别需要经历:

Deep Architecture Learning 的目标即如何在尽可能没有人工参与的情况下实现从较低level的识别到较高level的识别。（不需要人工提供大量的训练样本，即无监督学习。）

设用k-1个层表示复杂函数f(x)的运算时间为tk−1,用k层表示的的运算时间为tk,那么很有可能

t k - 1 = O (e t k)

例如, 计算多项式Πni=1∑mj=1aijxj

kernel machine

f (x) = b + \sum i a i K (x, x i)

其中, b 和 ai 为第2层, K(x,xi)为第1层. 常用的kernel marchines包括支持向量机(SVMs), 高斯过程(GP), K-近邻, Nadaraya-Waston算法. Kernel machines 假设f(x)为光滑函数.

multi-layer neural networks
参考1. Multi-layer neuralnetworks
2. 多层神经网络
最大的困难: 优化!!