深入浅出统计学-第二章

数学公式笔记:

参考:https://katex.org/docs/supported.html

字幕 谬 :\mu
μ \mu

西格玛: \sum{f(x)}
f(x) \sum{f(x)}

分数:\frac{\sum{x}}{n} 写法是\frac{}{}, 分别在2个括号中写入内容

xn \frac{\sum{x}}{n}

加括号:\left( \right) f(x,y,z) = \left( \frac{7x+5}{1+y^2} \right) = \left( \right)

f(x,y,z)=(7x+51+y2)=() f(x,y,z) = \left( \frac{7x+5}{1+y^2} \right) = \left( \right)

深入浅出统计学-第二章

通常说的平均值,准确的叫均值。平均值包含了均值,中位数…等其他数值。 但是一般也都叫习惯了。

均值、中位数、众数:

1f(x)=Xn 公式1 f(x) = \frac{\sum{X}}{n}

2f(x)=fxf 公式2 f(x) = \frac{\sum{fx}}{\sum{f}}

1和2都表示求均值;
公式1的分子是总数,分母是总频数。
公式2的分子是每个数字乘以频数再将结果相加,分母是频数和。

统计中会出现异常值,这些数值会与其他数值相差太大。当异常值存在时, 会将整体数据的均值向左或者向右 ‘拉’。称为数据偏斜。
当出现数据偏和异常值时,均值就不再适用,就需要使用其他方式表示典型值。
此时要说到中位数

(1)中位数永远处于中间;
(2)如果是奇数个数值,中位数的位置是 (n + 1) /2
(3) 如果是偶数个数值,需要将中间2个数相加,在除以2。

根据实际情况选择使用均值或者中位数;均值对于抽样数据来说更稳定。

当均值和中位数都不能全面的表述出整体数据的时候, 要考虑众数
众数为在数据中出现次数最多的。 当然会存在多个数出现了同样的次数的情况,就会出现多个众数。

众数是唯一能用于类别数据的平均数。

深入浅出统计学-第二章