如何解析CDSW的Prometheus和Grafana功能分析

如何解析CDSW的Prometheus和Grafana功能分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

文档编写目的      

在CDSW1.7及以后版本引入了Prometheus + Grafana提供了一套可视化的Dashboard,可以监视CDSW中各个Pod是如何使用集群的CPU/GPU、内存及存储资源。Prometheus是一个内部的时序数据源,会自动记录CDSW中每个部署资源使用数据,Grafana是一个可视化的监控仪表盘,可以自定义自己的监控图表。CDSW默认已提供了3个Grafana的Dashboards:K8 Cluster,K8s Container 和K8 Node,通过提供的基础监控仪表盘可以创建更多的自定义监控图表。本文档会介绍如何查看及使用Grafana。

  • 测试环境

1.CDSW1.7.2

功能介绍及使用    

2.1 Grafana监控界面

1.使用管理员登录CDSW,进入“Admin”>“Overview”页面,然后点击链接跳转

如何解析CDSW的Prometheus和Grafana功能分析

2.Grafana主页如下:

如何解析CDSW的Prometheus和Grafana功能分析

3.点击左上角的Home,可以看到Grafana默认提供的三个仪表盘:

如何解析CDSW的Prometheus和Grafana功能分析

如何解析CDSW的Prometheus和Grafana功能分析

2.2 K8s Containers Dashboard

进入K8s Containers的Dashboard界面,该监控图表主要提供了CDSW集群中所有启动的Pods监控信息(每个pod的资源使用情况)

Pods使用的内存和CPU:

如何解析CDSW的Prometheus和Grafana功能分析

Pods使用的CPU曲线图以及各进程使用的CPU情况:

如何解析CDSW的Prometheus和Grafana功能分析

Pods使用的内存曲线图以及各进程使用的内存情况:

如何解析CDSW的Prometheus和Grafana功能分析

Pods使用的网络IO曲线图以及各进程使用的网络IO情况

如何解析CDSW的Prometheus和Grafana功能分析

查看单个pod的资源使用情况(可以对应到CDSW启动的Session)

如何解析CDSW的Prometheus和Grafana功能分析

如何解析CDSW的Prometheus和Grafana功能分析

2.3 K8s Node Dashboard

进入K8s Node的Dashboard界面,该监控仪表盘主要提供了CDSW集群所有Node节点资源使用情况的监控(可以理解为服务器级别的资源使用监控),包括CPU、内存、磁盘、网络等。

如何解析CDSW的Prometheus和Grafana功能分析

2.4 K8s Cluster Dashboard

进入K8s Cluster的Dashboard界面,该监控仪表盘主要提供了对K8s Cluster所有NameSpace级别的资源使用情况监控(通过该Dashboard可以看到用户级别的资源使用情况)

如何解析CDSW的Prometheus和Grafana功能分析

如何解析CDSW的Prometheus和Grafana功能分析

指定Namespace(default-user-{userid}该类型的Namespace即为用户级别的监控)

如何解析CDSW的Prometheus和Grafana功能分析

如何解析CDSW的Prometheus和Grafana功能分析

2.5 自定义Dashboard

1.创建一个自定义的Dashboard

如何解析CDSW的Prometheus和Grafana功能分析

如何解析CDSW的Prometheus和Grafana功能分析

2.选择创建一个Graph类型的图表

如何解析CDSW的Prometheus和Grafana功能分析

3.选择Edit

如何解析CDSW的Prometheus和Grafana功能分析

4.进入图表编辑界面,选择数据源并输入查询语句完成图表的构建

如何解析CDSW的Prometheus和Grafana功能分析

5.点击右上角的保存按钮将构建的图表保存至自定义的Dashboard即可

如何解析CDSW的Prometheus和Grafana功能分析

1.CDSW1.7.x的新功能Grafana,可以很好的监控CDSW上的资源使用情况,包括系统服务以及用户使用。

2.Grafana中支持告警的配置,可以针对仪表盘进行配置,触发阈值后会进行告警。

3.除了系统提供的默认Dashboard,还可以进行自定义,将想要监控的指标通过PromQL语句转化成图表即可。

关于如何解析CDSW的Prometheus和Grafana功能分析问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。