数据挖掘 Chapter 8 - 分类:基本概念

数据挖掘 Chapter 8 - 分类:基本概念

说明,由于第5、6、7章主要内容是数据仓库技术和模式挖掘。前者与笔者工作关系不大,后者比较偏,所以暂时跳过。

决策树归纳

决策树是一种类似于流程图的树结构,其中,每个内部节点(非叶节点)在一个属性上进行测试,每一个分枝表示该测试的一个输出。

受欢迎的原因
  • 决策树分类器的构造不需要任何领域知识或参数设置,因此适合于探索式知识发现。

  • 决策树可以处理高维数据

  • 获取的知识用树的形式表示是直观的,并且容易被人理解。

算法流程

数据挖掘 Chapter 8 - 分类:基本概念

决策树归纳的关键点杂鱼分裂准则,也就是怎么判断“最好”的将元组划分成个体类的方法

属性选择度量

是一种选择分裂准则

  • 信息增益
  • 增益率
  • 基尼系数