集成学习方法概述

集成学习方法概述

#集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system) 、基于委员会的学习(committee-based learning) 等.

#集成学习具有比基学习器更强的泛化能力

#在集成学习中基学习器称为弱学习器

1.通用的集成学习框架:

#一个集成由多个基学习器构成,基学习器由基学习算法在训练数据上训练获得,可为决策树、神经网络或其他算法

#大多数集成学习方法使用同一种基学习算法产生同质的基学习器,即相同种类的学习器,生成同质集成

#也有使用多种学习算法训练不同种类的学习器,构成异质集成。在异质集成中称学习器为个体学习器或组件学习器

集成学习方法概述

#集成学习的发展得益于三个方面的早期研究分类器结合、弱分类器集成和混合专家系统

#构建集成两个步骤

  • 首先产生基学习器
  • 然后将它们结合起来

#构建一个集成的代价未必会显著高于构建单一学习器

#无免费午餐定理:不存在一个学习算法会一致地比其他学习算法好

参考文献:
【1】《集成学习基础与算法 》第1版 电子工业出版社 [中] 周志华 著 李楠 译
【2】《机器学习 》第1版 清华大学出版社 [中] 周志华 著