01.描述性统计(均值,中位数,众数,方差,标准差,与常见的统计图表)
参考:某平台的统计学基础课ppt
一.描述性统计概念
描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度。例:每次考试算的平均分,最高分,各个分段的人数分布等,也是属于描述统计学的范围。
二.集中程度(集中趋势)
1.常用的指标:
均值——算术平均数,描述平均水平
中位数——将数据按大小排列后位于正中间的数描述,描述中等水平
众数——数据中出现最多的数,描述一般水平
优点 | 缺点 | |
---|---|---|
均值 | 充分利用所有数据,适用性强 | 容易受到极端值影响 |
中位数 | 不受极端值影响 | 缺乏敏感性 |
众数 | 当数据具有明显的集中趋势时,代表性好;不受极端值影响 | 缺乏唯一性:可能有一个,可能有两个,可能一个都没有 |
三.离散程度
1.常用的指标:
方差:是各个数据与平均数之差的平方的平均数。(数据离中心越远越离散)
标准差:方差开跟号
方差公式:
2.图表表示:
只依赖数字来描述集中趋势不离散程度,让人
难以对数据产生直观地印象,这时就需要用到图表
常见的图表:直方图、茎叶图、箱线图、饼图、线图、柱状图