机器学习聚类知识总结
-
聚类任务的标准定义:
聚类结果的性能度量:同一簇相似度高,不同簇相似度低。
A.内部指标:
B.外部指标:距离计算:
距离度量的定义
闵科夫斯基距离
欧式距离 (p=2)
曼哈顿距离 (p=1)
对于无序属性采用VDM距离
综合起来处理:-
基于原型的聚类:k均值算法
-
基于密度的聚类: DBSCAN算法
基于层次的聚类:AGENT算法
聚类任务的标准定义:
聚类结果的性能度量:同一簇相似度高,不同簇相似度低。
A.内部指标:
B.外部指标:
距离计算:
距离度量的定义
闵科夫斯基距离
欧式距离 (p=2)
曼哈顿距离 (p=1)
对于无序属性采用VDM距离
综合起来处理:
基于原型的聚类:k均值算法
基于密度的聚类: DBSCAN算法
基于层次的聚类:AGENT算法