数据挖掘 Chapter 8 - 分类:基本概念
数据挖掘 Chapter 8 - 分类:基本概念
说明,由于第5、6、7章主要内容是数据仓库技术和模式挖掘。前者与笔者工作关系不大,后者比较偏,所以暂时跳过。
决策树归纳
决策树是一种类似于流程图的树结构,其中,每个内部节点(非叶节点)在一个属性上进行测试,每一个分枝表示该测试的一个输出。
受欢迎的原因
-
决策树分类器的构造不需要任何领域知识或参数设置,因此适合于探索式知识发现。
-
决策树可以处理高维数据
-
获取的知识用树的形式表示是直观的,并且容易被人理解。
算法流程
决策树归纳的关键点杂鱼分裂准则,也就是怎么判断“最好”的将元组划分成个体类的方法
属性选择度量
是一种选择分裂准则
- 信息增益
- 增益率
- 基尼系数