#88 哆啦A梦—基于 Prometheus 的企业监控平台的设计与实现
#88 哆啦A梦—基于 Prometheus 的企业监控平台的设计与实现
这个主要讲的是 360 基于 Prometheus 开源的企业监控告警平台
https://www.bilibili.com/video/BV1Kv411B7hZ
360 搜索事业部云平台一直致力于将容器技术在生产环境中落地,已开源企业级 Kubernetes 管理平台Wayne,并经历了在生产环境大规模应用的考验。当下Prometheus 是被广泛应用的监控系统,既是容器时代的标配,也同时解决了应用指标监控的问题。然而它的报警模块 Alertmanager 还有一些地方不是很完善,使用起来不够灵活,针对这一问题,我们开发并开源了哆啦A梦报警平台 https://github.com/Qihoo360/doraemon
大纲
- Prometheus 在 360 搜索云平台的应用
- Alertmanager 的痛点以及哆啦A梦的设计思路
- 哆啦A梦的功能介绍
- 哆啦A梦的快速部署
- 哆啦A梦报警聚合的实现
- 哆啦A梦对 Prometheus 报警标签(Labels)的快速匹配算法
https://github.com/Qihoo360/doraemon/blob/master/docs/readme-CN.md