SPSS:基本统计分析(一)
SPSS:基本统计分析(一)
统计科学分为两大部分:描述性统计和推断性统计。
描述性统计提供了将原始数据整理成有用形式的方法,这些方法包括收集、整理、概况、描述及给出数据的信息。具体来讲,这些方法包括将统计资料整理成表格的形式,图形的形式,用平均数、中位数、众数等度量集中趋势,用极差、标准差、变异系数等度量离散程度。
1.频数分析
基本的统计分析往往是由频数分析开始的。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有帮助的。
基本任务
编制频数分布表
SPSS中频数分布表包括的内容:
- 频数:变量值落在某个区间(或某个类别)中的次数
- 百分比:各频数占总样本量的白分比
- 有效百分比:各频数占有效样本量的百分比(有效样本量=总样本量-缺失样本量)
- 累计百分比:各百分比逐级累加的结果,最终取值为100%
绘制统计图
柱形图、条形图、饼图、直方图
相关概念
均值标准误:是对样本均值与总体均值之间平均差异程度地估计。
操作
2.计算基本描述统计量
基本描述统计量
刻画集中趋势的描述统计量
- 算数平均
- 中位数
- 众数
- 调和均数
- 几何均数
- 截尾均数
刻画离散程度的描述统计量
- 样本标准差
- 样本方差
- 全距
- 变异系数
- 四分位数、四分位数间距、百分位数
刻画分布形态的描述统计量
数据的分布形态主要指数据分布是对称、偏斜程度如何、分布陡缓程度等。
-
偏度(Skewness)
样本偏度系数:
偏态的方向指的应当是长尾的方向,而不是高峰的位置。
α=0,分布为对称分布
α<0,分布为负偏或左偏,即长尾巴在左边,峰尖偏右
α>0,分布为正偏或右偏,即长尾巴在右边,峰尖偏左 -
峰度(Kurtosis)
样本的峰度系数:
β=0,分布为正态峰
β<0,分布为低峰度的,即形状要比正态分布的峰平坦
β>0,分布为高峰度的,即形状要比正态分布的峰陡峭,峰的形状也比较尖
操作
数据的标准化
SPSS中的Descriptive过程可以将原变量转换为标准正态分布的得分