决策树随机森林

目录

 

决策树的过拟合

剪枝算法

Bootstraping

应用

一种可能的方案

样本不均衡的常用处理方法

使用RF建立计算样本间相似度

Isolation Forest

决策树分类鸢尾花数据

随机森林

决策树用于拟合

多输出的决策树回归


决策的过

决策树对训练属于有很好的分类能力,但对 未知的测试数据未必有好的分类能力,泛化 能力弱,即可能发生过拟合现象。

解决的方法:剪枝,随机森林。

剪枝数的

决策树随机森林

剪枝

决策树随机森林

Bootstraping

Bootstraping的名称自成pull up by your own  bootstraps意思是依你自的资,称自助 法,它是一种有放回的样方

Bagging

bootstrap aggregation

从样本集中重采样(有重复的)选出n个样本,在所有属性上,对这n个样本建立分类器(ID3C4.5CARTSVMLogistic回归等)重复以上两步m次,即获得m个分类器,将数据放在这m个分类器上,最后根据个分类器的投票结果,决定数据属于哪一类。

随机森林

随机森林在bagging基础上做了修改。从样本集中用Bootstrap采样选n样本;从所有属性中随机选择k性,择最分割 属性作为节点建CART决策;重复以上两步m次,即建立了mCART决策树,这mCART机森林通过投表决结,  决定数据属于哪一类。

应用

决策树随机森林

 

一种能的

决策树随机森林

样本均衡常用理方法

决策树随机森林

使用RF建立计算本间似度

决策树随机森林

x1,x3在同叶节点中,即相似度大,x1,x3与x2相似度不大。

决策树随机森林

 

Isolation Forest

决策树随机森林

 

决策树随机森林

决策树分类鸢尾花数据

决策树随机森林

随机森林

决策树随机森林

决策用于

决策树随机森林

多输的决树回归

决策树随机森林