林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen
本次的课程笔记完毕。后面的课程笔记主要是hinton大神的深度学习课程。

希望在看问题之前看看机器学习的处理流程,这样流程中的每个步骤很多地方采用不同的模型。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

概要

上传讲到了矩阵分解这样的模型,本节是对这次课程的一个总结。

特征提取技巧

kernel 转换

我们学习到了各种各样的转换,kernel转换,然后kernel再配合线性模型就可以做一些非线性模型。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

aggravatiton 转换

决策树桩,决策树,RBF就相当于基函数,然后通过blending的方法进行模型融合。各种模型之间融汇贯通。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

自动提取特征

这里相当于把特征看做一个变量,自动提取的方式实现。Adaboost这样的模型可以把基本的函数看做特征,最后做了模型融合。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

低维度转换

把之类投影到低维度上去,然后进行计算。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

优化技巧

最优化

一般优化技巧就是梯度下降的方式。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)
这里通过梯度下降,还有一些变形,比如泰勒二次展开,可能就是牛顿法了。

问题转换

这里原始问题比较难,通过对偶,表示等方法进行求解。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

子问题求解方式

当原问题比较难,通过问题拆解的方式,或者交互的方式求解。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

过拟合处理方式

当模型足够复杂的时候,容易过拟合,这个时候可能就需要做一些正则化的事情。

踩刹车方式

常用的方式就是在一些地方限制模型的能力,加上一些条件。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

盯住仪表盘

当模型过于复杂的时候,要时刻看看模型的情况,比如通过交叉验证的方式。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

机器学习实践

这里介绍的是林老师在kddcup中的实践。
2010年的kddcup的流程
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)
2011年kddcup的步骤:
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

2012年kddcup
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

2013年的kddcup
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

2006年统计的十大数据挖掘算法
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

一堆机器学习算法,学会融汇贯通。
林轩田之机器学习课程笔记( distilling hidden features之final)(32之32)

欢迎转载,可以关注博客:http://blog.csdn.net/cqy_chen