《人人都会数据分析》笔记:数据离散程度描述

《人人都会数据分析》笔记:数据离散程度描述

离散程度描述:可以用来说明事物在发展过程中的均衡性、节奏型和稳定性的问题。

离散程度指标:全距、平均差、方差、标准差、离散系数

全距:数据中最大值与最小值的差值。R=Xmax-Xmin

           不足:是一个比较粗糙的测度指标,若数据集合存在极大值或极小值就不适用。

           离散指标的数据越小,说明数据的变异程度越小;离散指标的数据越大,说明数据的变异

           程度越大。(仅适用于在同类离散指标相比:全距和方差没法比)

 

平均差:Mean Absolute Deviation

《人人都会数据分析》笔记:数据离散程度描述各项数值减去均值的绝对值之和的平均值。

方差:Variance

《人人都会数据分析》笔记:数据离散程度描述

标准差:StandardDeviation

《人人都会数据分析》笔记:数据离散程度描述

样本的方差和标准差与总体不一样:分母是n-1(自由度)

《人人都会数据分析》笔记:数据离散程度描述

离散系数

标准差相对于均值的大小。如果比较均值不相同的两组数据相对离散程度时,使用

离散系数,要比使用标准差更准确。

V=标准差/均值