单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

单峰分布(unimodal distribution)& 双峰分布 (bimodal distribution)

数据分布会有一个或者很多个峰值(peaks),数据分布中只有一个明显峰值的叫做单峰,有两个明显峰值的叫做双峰,同样,具有多个峰值的就是多峰。

单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

偏态分布(skewness distribution)

在数据分布的图像展现形式中,偏态分布中一边的观测值要比另一边的观测值多,右边的观测值少时,称为右偏(skewed right);左边的观测值少时,称为左偏(skewed left)。相对于正态分布,右偏的分布也称为正偏态分布,以平均数(average)、中位数(median)和众数(mode)之间的关系来描述的话,若 xˉ>Me>Mo\bar{x} > M_{e} > M_{o},也即是平均数大于中位数,中位数又大于众数时,数据分布时正偏态分布。

单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

左偏的分布也称为负偏态分布,若 xˉ<Me<Mo\bar{x} < M_{e} < M_{o},也即是平均数小于中位数,中位数又小于众数时,数据分布时负偏态分布。

单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

均匀分布(uniform distribution)

当一组数据中的观测值在分布范围内均匀分布时,这种分布称为均匀分布。均匀分布没有明显的峰。

正态分布(normal distribution)

当数据的分布图,既具有对称性,又具有单峰时,就是正态分布,也即是单峰对称分布就是正态分布

单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

异常特性(Unusual Features)

数据分布中的异常特性主要是两种:缺口(gaps) & 异常(outliers)
缺口主要是指数据分布中有些区域没有观测值:

单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

异常主要是与数据分布差别很大的极端值。在正态分布中,如果极值低于第一个四分位数(Q1)至少1.5个四分位数区间,或者高于第三个四分位数(Q3)至少1.5个四分位数区间,那么极值通常被认为是一个离群值。

单峰分布(unimodal distribution)、双峰分布 (bimodal distribution)以及偏态分布(skewness distribution)

Ref

Data Patterns in Statistics