机器学习之非监督学习

非(无)监督学习概述 

概念和意义:

非监督学习是一种机器学习的方式,并补血药人力来输入标签,是监督式学习和强化学习等策略之外的一种选择。在监督式学习中,典型的任务是分类和回归分析且需要使用到人工于谦准备好的范例(base)。

WHY:

  • 根据事物的本身属性去分辨事物,在无监督学习过程中,训练样本的编辑信息是未知的,无监督学习可以通过对无标记训练样本的学习来解释数据的内在性质和规律,为进一步的数据分析提供基础。
  • 与监督学习的方法结合,做半监督学习等。
  • 用于神经网络的隐藏层的感知函数定义等。

方法类型:

  1. 聚类:K-means,层次聚类,密度聚类
  2. 神经网络中的疏稀化编码
  3. 降维:PCA

运用方向:

  • 群体分类,图像分割。
  • 挖掘数据内部特征。

K-means

机器学习之非监督学习

距离度量:

  1. minkowski distance --lamda 可以任意取值,可以是正数,无穷大等
  2. Euclidean distance  --lamda=2的情况
  3. cityblock distance --lamda =1的情况

 

 

参考资料:

DC 学院:袁烨《机器学习》