三维点云学习（3）2- K-Means

K-Means的具体构建流程

将输入的N个数据点，分为N个类
1.随机选取K个中心点
2.E-Step(expectation)：N个点、K个中心，求N个点到K个中心的nearest-neighbor
3.M-Step(maximization)：更新中心点的位置，把属于同一个类的数据点求一个均值，作为这个类的中心值
4.不断重复2、3步
# 三维点云学习（3）2- K-Means

K-Means数学上的定义

K-Means的本质是一直优化损失函数 J
# 三维点云学习（3）2- K-Means

最小化损失函数

最小化损失函数有两种方法：E-step(expectation)、M-step(maximization)
$\mu\,k：类的中心点$
$\Upsilon\,nk：bool值变量，判断是点是否属于该类$

expectation

使得最近的Uk所对应的Rnk的值为1，其他值为0，可以尽可能的降低损失函数
# 三维点云学习（3）2- K-Means

maximization

一个类的中心点Uk等于属于这类的点的均值
# 三维点云学习（3）2- K-Means

K-Means过程的图示

(b) ©两步交替进行
# 三维点云学习（3）2- K-Means
判断算法收敛：
条件1：算法中心点Uk不再移动或者移动得较少
条件2：Rnk不在变化
现实中第三种情况，分到最后会出现一个点不断跳动振荡，需要考虑处理这种罕见的情况

K-Means Tricks

1.初始化选择Uk时，可以选取数据点里的点作为初始的中心点
2.执行多次K-Means迭代，选择损失函数最小的一次为最终的结果
3.在E-step(expectation)，可以使用octree或者kd-tree的方法寻找最临近点，确定Rnk
4.Mini-bath K-Means：每次迭代里，都选不一样的assemble
# 三维点云学习（3）2- K-Means