可用度计算总结
可用度计算方案:
术语:
MTTR、MTTF、MTBF是体现系统可靠性的重要指标,但是三者容易混淆,下文使用图解方式解释三者之间的区别,希望能起到解惑的效用。
MTTF (Mean Time To Failure,平均无故障时间),指系统无故障运行的平均时间,取所有从系统开始正常运行到发生故障之间的时间段的平均值。 MTTF =∑T1/ N
MTTR (Mean Time To Repair,平均修复时间),指系统从发生故障到维修结束之间的时间段的平均值。MTTR =∑(T2+T3)/ N
MTBF (Mean Time Between Failure,平均失效间隔),指系统两次故障发生时间之间的时间段的平均值。 MTBF =∑(T2+T3+T1)/ N
很明显:MTBF= MTTF+ MTTR
计算方案:
在告警系统中:
单机可用度 = MTTF / MTBF
MTTF(∑T1/ N) :
平均无灾难级别告警的时间
MTTR(∑(T2+T3)/ N)
灾难级别告警从产生到修复的平均时间
MTBF(∑(T2+T3+T1)/ N):
灾难级别告警从上次修复到下次产生并修复的平均时间
具体计算逻辑:
(1)当至少有一个未解决的灾难级别告警时:系统可用度为0%
(2)当有0个未解决的灾难级别告警时:
a. 若已解决的灾难级别告警数为0,则系统可用度为100%
b. 若已解决的灾难级别告警数大于0,则系统可用度采用下面公式计算
(∑T1/ N)/ (∑(T2+T3+T1)/ N)
= (∑T1)/ ∑(T2+T3+T1)
=∑(第二条灾难告警的开始时间 - 第一条灾难告警的修复时间)/ 最后一条灾难告警修复的时间 - 第一条灾难告警修复的时间