k8s集群监控【采用Prometheus+Grafana】

前言

Prometheus 最初是 SoundCloud 构建的开源系统监控和报警工具，是一个独立的开源项目，于2016年加入了 CNCF 基金会，作为继 Kubernetes 之后的第二个托管项目。

特征

Prometheus 相比于其他传统监控工具主要有以下几个特点：

具有由 metric 名称和键/值对标识的时间序列数据的多维数据模型

有一个灵活的查询语言

不依赖分布式存储，只和本地磁盘有关

通过 HTTP 的服务拉取时间序列数据

也支持推送的方式来添加时间序列数据

还支持通过服务发现或静态配置发现目标

多种图形和仪表板支持

组件

Prometheus 由多个组件组成，但是其中许多组件是可选的：

Prometheus Server：用于抓取指标、存储时间序列数据

exporter：暴露指标让任务来抓

pushgateway：push 的方式将指标数据推送到该网关

alertmanager：处理报警的报警组件

adhoc：用于数据查询

大多数 Prometheus 组件都是用 Go 编写的，因此很容易构建和部署为静态的二进制文件。

架构

下图是 Prometheus 官方提供的架构及其一些相关的生态系统组件：

整体流程比较简单，Prometheus 直接接收或者通过中间的 Pushgateway 网关被动获取指标数据，在本地存储所有的获取的指标数据，并对这些数据进行一些规则整理，用来生成一些聚合数据或者报警信息，Grafana 或者其他工具用来可视化这些数据。

参考

https://juejin.im/post/5d4ac8e9f265da03e921b463

https://www.qikqiak.com/k8s-book/docs/52.Prometheus%E5%9F%BA%E6%9C%AC%E4%BD%BF%E7%94%A8.html

https://yunlzheng.gitbook.io/prometheus-book/parti-prometheus-ji-chu/alert/prometheus-alert-rule

https://www.jianshu.com/p/ac8853927528

k8s集群监控【采用Prometheus+Grafana】

前言

特征

组件

架构

参考

相关推荐