马氏距离
含义一
马氏距离可以描述一个点P到一个分布D之间的距离
设这个点P为
D分布均值为
D分布协方差矩阵为S
则P点到D分布之间的马氏距离为:
含义二
也可表示两个向量
D分布协方差矩阵为S
则两向量距离为
理解马氏距离
当求距离的时候,由于随机向量的每个分量之间量级不一样,比如说
马氏距离除以了一个方差矩阵,这就把各个分量之间的方差都除掉了,消除了量纲性,更加科学合理
(图片来自:链接)
如上图,看左下方的图,比较中间那个绿色的和另外一个绿色的距离,以及中间绿色到蓝色的距离
如果不考虑数据的分布,就是直接计算欧式距离,那就是蓝色距离更近
但实际上需要考虑各分量的分布的,呈椭圆形分布
蓝色的在椭圆外,绿色的在椭圆内,因此绿色的实际上更近
马氏距离除以了协方差矩阵,实际上就是把右上角的图变成了右下角