# Linux C++ 程序占cpu%问题排查
Linux C++ 程序占cpu%问题排查
缘起
对一个服务(room_status_server)进行了一些优化,并顺便修改了部分配置文件,重启后用top命令
观察,发现该程序cpu几乎占到了100%
。
初步判断
发现这个问题后,想到前两天还上线了该服务,立马去线上看了看,还好线上是正常的。那么问题肯定是刚才的修改导致的!
把线上的版本拿过来运行,还是cpu几乎占到了100%
,那很大可能是配置文件哪里改错了(后面验证表明我的猜测是对的)。
想到这是一个好的学习的机会,我想还是从运行的程序来看看到底出了什么事。
定位问题
思路:
- 程序占用100%的cpu,程序即进程,也就是说进程占了100%的cpu(一个核)
- 一个进程有多个线程,究竟是哪一个线程占了100%的cpu?
- 这个线程在干什么?
1. 查看程序的进程号
命令:top -c
。 输入大写P
,top的输出会按使用cpu多少排序。
PID
就是进程号,我程序的进程号是4918
。
2. 查看耗CPU的线程号
命令:top -Hp 进程号
。 同样输入大写P
,top的输出会按使用cpu多少排序。
输入top -Hp 4918
,展示内容如图:
可以看出PID是4927
的线程占到了100%的cpu,我的业务日志是打印线程号的,打开日志,哦~~ 原来是这个原因(先卖个关子不说)。
3. 查看耗CPU的任务
上面找到了耗CPU的线程,那这个线程在做什么呢?
看线程在干什么,可以看线程的堆栈,命令是pstack 进程号
,会输出所有线程的堆栈信息。
输入pstack 4918
,并搜索线程4927
的堆栈,展示内容如图:
从堆栈信息看,程序在执行boost创建socket监听等任务,为什么一直执行这个呢?因为,我的端口号重复使用了。
终章
其实从堆栈信息定位问题还是有些抽象的,但是大概可以看出线程在做什么,至少给排查问题指明了方向。