《人人都会数据分析》笔记:数据离散程度描述
离散程度描述:可以用来说明事物在发展过程中的均衡性、节奏型和稳定性的问题。
离散程度指标:全距、平均差、方差、标准差、离散系数
全距:数据中最大值与最小值的差值。R=Xmax-Xmin
不足:是一个比较粗糙的测度指标,若数据集合存在极大值或极小值就不适用。
离散指标的数据越小,说明数据的变异程度越小;离散指标的数据越大,说明数据的变异
程度越大。(仅适用于在同类离散指标相比:全距和方差没法比)
平均差:Mean Absolute Deviation
各项数值减去均值的绝对值之和的平均值。
方差:Variance
标准差:StandardDeviation
样本的方差和标准差与总体不一样:分母是n-1(自由度)
离散系数
标准差相对于均值的大小。如果比较均值不相同的两组数据相对离散程度时,使用
离散系数,要比使用标准差更准确。
V=标准差/均值