您的位置: 首页 > 文章 > 《统计学习方法》——第三章 K近邻法

《统计学习方法》——第三章 K近邻法

分类: 文章 • 2024-07-02 22:49:04

本章讨论的是分类问题中的K近邻法

3.1 K近邻算法

算法简述：

《统计学习方法》——第三章 K近邻法

当K取3时，绿色点属于红类；当K取5时，绿色点属于蓝类。
在右图中，距离度量采用欧氏距离。

3.2 K近邻模型

3.2.1 模型

没有类似于感知机模型的函数表示，理解理解。

《统计学习方法》——第三章 K近邻法

若K=1，则为最近邻模型。测试实例在哪个训练实例点的单元（上图的方框）范围内就属于哪个类别。

3.2.2 距离度量

Lp距离

p=1时，称为曼哈顿距离。（1，0）和（0.5，0.5）到（0，0）的距离是一样的
p=2时，称为欧式距离
p=无穷，它是各个坐标距离的最大值。坐标里的最大值即为距离。

《统计学习方法》——第三章 K近邻法

3.2.3 K值的选择

交叉验证！！！！用验证集定K值。

3.2.4 分类决策规则

《统计学习方法》——第三章 K近邻法

取经验风险最小化的类别。

3.3 k 近邻法的实现：kd树

（用的时候再补）