睿象云:为什么 Zabbix 告警如此火热?
每当我们谈及监控工具的时候,Zabbix 总是最惹人瞩目的那一个。如同清晨荷叶上的剔透露珠,卓尔不凡;如同巷子末头的百年酒香,让人倾心。我们都知道 Zabbix 是监控工具里当仁不让的龙头大哥,却没几人能清楚掰扯出背后的走马历史,今天,小编略献拙笔,给大家浅析一下 Zabbix 大热下的因果缘由。
起初
作为一项“舶来品”,Zabbix 初来中国之时,便受到了美团、小米、360 等互联网公司的热爱,包括文青聚集地-豆瓣,以经营业务广泛著称的58同城,和活跃于影视行业里的 PPTV 。这些互联网公司无不钟情于使用 Zabbix 来监控告警,因为他们喜欢 Zabbix 的简易, Zabbix 的稳定,和 Zabbix 的完善功能所带来的可靠护航能力。
企业体大,唯有千万不疏方能固若金汤。
在江湖对 Zabbix 的倾心追捧下,是其出厂自带的强大特点,极具优势,引领风华;是其谆谆善诱的学习规则,亦步亦趋,层层高进。
出厂自带的强大特点
1.数据收集
-
可用性、性能检测。
-
支持Agent 、 SNMP (包括 Trapping 和 Polling ) 、IPMI 、JMX 、 SSH 、Telnet 等。
-
自定义检测。
-
自定义收集数据的频率。
-
客户端/代理端/服务器端模式。
2.灵活的触发器
-
可以定义非常灵活的告警阈值和与多种告警相关联的条件。
3. 高度可定制的告警
-
发送通知,可定制包括告警级别、动作升级、收件人和媒体类型。
-
通知可以使用全局宏变量和自定义变量。
-
自动处理功能包括远程命令的自动调用和执行。
4.实时的绘图功能
-
监控项将数据实时绘制在图形上。
5. Web 监控能力
-
Zabbix 可以模拟浏览器请求访问一个网站,并检查返回值和响应时间。
6.多种可视化展示
-
可以自定义监控的展示图,将多种监控数据集中展示到一张图上。
-
网络拓扑图。
-
自定义的 Screens 和 Slide shows 可以将多种图形集中展示。
-
报表功能。
-
资源使用情况的监控展示。
7.历史数据的存储
-
将数据存储在数据库中。
-
历史数据的存放周期可配置。
-
定期删除过期的历史数据。
8.配置非常容易
-
配置比较简单,只需要以下两步即可。
(1)添加设备。
(2)应用模板即可完成监控。
9.使用模板
-
模板可以分组。
-
模板具有可继承性。
10.网络发现
-
支持自动发现网络设备和服务器(可以通过配置自动发现服务规则实现)。
-
Agent 自动注册。
-
支持用自动发现( Low Level Discovery )实现动态监控项的批量监控(支持自定义),内置的自动发现包括文件系统、网络接口、 SNMP OID ,可定制自动发现。
11.快速的访问接口
-
Web 页面基于 PHP 。
-
远程访问。
-
日志审计。
12. API 功能
-
应用 API 功能可以方便地与其他系统结合,包括手机客户端的使用。
13.系统权限
-
不同的用户展示监控的资源不同
-
用户身份认证
14.程序特性
-
服务器端 Zabbix-Server 和采集端 Zabbix-Agcnt 使用C语言编写,其性能非常高,内存开销非常小。
15.大型环境的支持
-
利用 Zabbix-Proxy 方式可轻松构建远程监控。
谆谆善诱的学习规则
Zabbix 使用起来非常简单,使用者稍加学习即可上手,即使小白也可快速掌握。
这里暂且把对 Zabbix 的掌握程度分成3个阶段。
入门阶段:以前从未接触过任何监控系统,也不熟悉Linux 操作系统。在这个阶段,能够熟练地掌握 Zabbix 的安装和基本配置即可。
中级阶段:具备Linux 基础,熟悉 LAMP 和 LNMP 环境搭建、MySQL 数据库、Shell 脚本,以及具有简单的英文阅读能力,主要难点在于触发器、数据库调优和 API 的使用。在这个阶段,使用者可以将 Zabbix 与其他系统进行集成对接。
高级阶段:熟悉 PHP 语言或 C 语言,具备二次开发能力,能够修改源码,可以对 Zabbix 从代码级别进行优化和扩展。在这个阶段,使用者一般都能熟练地掌握 Zabbix 的各个功能,已经从使用阶段到了源码级别的研究阶段,因此主要是对编程能力的要求。
随着不断的学习和研究,我们的知识水平也会水涨船高,逐节提升。因为在使用Zabbix 的过程中,也会学习其背后的知识和原理,这时候就不止是掌握 Zabbix 了,而是要掌握一套监控体系的知识,因此,通过不断的积累和沉淀,我们就具备了举一反三、 触类旁通的能力。所以,学习 Zabbix 的过程,(对于工作上的帮助)将会让我们终身受益。
然而,即使 Zabbix 可以自定义非常灵活的告警阈值和与多种告警相关联的条件,但是混合型多工具的告警接入与告警流程的智能管理却是 Zabbix 的短板,致使单一的监控并不能实现有效的告警管理。
在信息化,大数据的今日,运维工作越加繁琐,倘若不能有效地管理告警,单一的监控工作再优秀也于事无补。
因此,依托一个强大的告警管理平台,可以让拥有精准监控工具的运维工作更上一层楼,帮助运维人员统一管理海量告警信息,精准维护系统安全环境!
智能告警平台 Cloud Alert (以下简称 CA 平台)秉承着轻松接入,智能管理的原则,提供跨多家公有云的告警实时接入,同时支持 Zabbix 、Nagios 、Cacti 、Solarwinds 、Prometheus 等主流监控工具对接,实现对不同厂商,不同工具接入的告警集中管理,快速定位问题根源。
对于运维人员头疼不已的告警风暴问题,CA 平台会自动基于时间序列,将相同的事件/告警压缩,达到自动去重的目的,然后将相似、同源告警再次进行规则压缩,再通过我们海量的算法积累进行智能降噪,使得最终呈现的报警有序而简洁,避免多重警报,一眼洞察难疑。
CA 平台更在传统告警通知方式上开发了分派策略与通知策略,进一步方便了运维人员的使用和监测,感兴趣的朋友可以查看往期文章:《 Zabbix + Cloud Alert 实践分享》,了解更多信息。
您也可以立即注册成为 CA 平台用户,体验智能告警平台 Cloud Alert 给您带来的全新震撼!