高斯分布

高斯分布,也称为正态分布。

通常如果我们认为变量 x 符合高斯分布 x~N(μ,σ2)则其概率密度函数为: 

高斯分布      高斯分布:均值     高斯分布:方差

我们可以利用已有的数据来预测总体中的 μ 和 σ2 的计算方法如下: 

高斯分布

注:机器学习中对于方差我们通常只除以 m 而非统计学中的(m-1)。只要你有一个还算大的训练集,到底是选择使用 1/m 还是 1/(m-1)其实区别很小。在机器学习领域大部分人更习惯使用 1/m 这个版本的公式。这两个版本的公式在理论特性和数学特性上稍有不同,但是在实际使用中,他们的区别甚小,几乎可以忽略不计。

高斯分布样例: (注意,高斯分布的概率密度面积是不变的

高斯分布