箱型图的知识总结
- 箱型图含义:箱型图是一种用作显示一组数据分散情况资料的统计图,常用于品质管理以及快速识别异常值。
- 箱型图特点:它可以不受异常值的影响,能够稳定地描绘出数据的离散分布情况,同时也利于数据清洗。
- 箱型图的"八大因数"
(1)下四分位数Q1(本博客以14个数据为例)
1) Q1=(n+1)/4 (这个式子是求Q1所在的位置,例如有15个数据,那么Q1就在第4个数据的位置,如果有14个数据,那么Q1在第 3和4个数据之间的位置)
2) Q1=(1/4)第3项数据+(3/4)
第4项数据 (此式子与Q1所在位置有密切关系,如果Q1在第5个数据和第6个数据之间,那 么就分别乘以第 5项数据和第6项数据,本博客选用14个数据)
(2)中位数Q2(中位数的位置以及值相信大家都会计算 ,这里不再赘述)
(3)上四分位数Q3
1) Q3=3(n+1)/4
2) Q3=(3/4)第11项数据+(1/4)
第12项数据
(4)上限(上边缘)
1) 四分位距 IQR=Q3-Q1
2) 上限值=Q3+1.5IQR
(5)下限(下边缘)
下限值=Q1-1.5IQR
(6)极上限
极上限值=Q3+3IQR
(7)极上限
极下限值=Q1-3IQR
(8)异常值
(1)位于上四分位数和上限之间以及下四分位数和下限之间的值为异常值,用"+"表示。
(2)位于上限与极上限之间以及位于下限与极下限之间的值为温和异常值,用"" 表示。
(3)位于极下限的下面以及极上限的上面的值为极端异常值,用"*" 表示。
4 matlab绘制箱型图
5 总结
这是本人对箱型图的一些理解,其中可能也有一些不正确的地方,希望大家能够多多批评指正,让我们一起进步。(本人会在下一篇博客具体讲述如何用matlab绘制箱型图),希望能够帮助大家。