博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
如何定位死循环或高CPU使用率(linux)
阅读量:4309 次
发布时间:2019-06-06

本文共 2408 字,大约阅读时间需要 8 分钟。

如何定位死循环或高CPU使用率(linux)

 确定是CPU过高

使用top观察是否存在CPU使用率过高现象

找出线程

对CPU使用率过高的进程的所有线程进行排序

ps H -e -o pid,tid,pcpu,cmd --sort=pcpu |grep xxx
得到如下结果,其中线程2909使用了7.8%的CPU.
2907 2913 0.0 ./xxx
2907 2909 7.8 ./xxx
也可以通过查看/proc中的信息来确定高CPU线程. 打印了4列,线程ID,线程名,用户时间和内核时间(排名未分先后)
awk '{print $1,$2,$14,$15}' /proc/2907/task/*/stat

找出调用栈

使用gdb attach nmsagent所在的进程,在gdb中使用 info threads显示所有线程

gdbgdb>attach 2907gdb>info threads

得到如下结果,可以发现2909线程的编号是12

13 Thread 0xad5f2b70 (LWP 2908)  0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1  12 Thread 0xad58eb70 (LWP 2909)  0x006e0422 in __kernel_vsyscall ()  11 Thread 0xad52ab70 (LWP 2910)  0x006e0422 in __kernel_vsyscall ()  10 Thread 0xad4f8b70 (LWP 2911)  0x006e0422 in __kernel_vsyscall ()  9 Thread 0xad4c6b70 (LWP 2912)  0x006e0422 in __kernel_vsyscall ()  8 Thread 0xad3feb70 (LWP 2913)  0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1  7 Thread 0xace08b70 (LWP 2914)  0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1  6 Thread 0xac607b70 (LWP 2915)  0x006e0422 in __kernel_vsyscall ()  5 Thread 0xac5e6b70 (LWP 2916)  0x006e0422 in __kernel_vsyscall ()  4 Thread 0xac361b70 (LWP 2917)  0x006e0422 in __kernel_vsyscall ()  3 Thread 0xac2fdb70 (LWP 2918)  0x006e0422 in __kernel_vsyscall ()  2 Thread 0xac1fcb70 (LWP 2919)  0x004ef0d7 in mq_timedreceive () from /lib/tls/i686/cmov/librt.so.1* 1 Thread 0xb78496d0 (LWP 2907)  0x006e0422 in __kernel_vsyscall ()

使用thread 切换线程,使用bt显示线程栈

gdb>thread 12gdb>bt

得到如下线程栈

#0  0x006e0422 in __kernel_vsyscall ()#1  0x001cca26 in nanosleep () from /lib/tls/i686/cmov/libc.so.6#2  0x001fc2dc in usleep () from /lib/tls/i686/cmov/libc.so.6#3  0x0806b510 in OspTaskDelay ()#4  0x0805c710 in CDispatchTask::NodeMsgSendToSock() ()#5  0x0805cc74 in DispatchTaskEntry ()#6  0x0806a8e9 in OspTaskTemplateFunc(void*) ()#7  0x00d4780e in start_thread () from /lib/tls/i686/cmov/libpthread.so.0 #8  0x002027ee in clone () from /lib/tls/i686/cmov/libc.so.6

 ps + strace

得到进程ID 21465

ps -e |grep cmu 4996 ?        00:00:25 cmu_fjga_sp321465 pts/5    00:08:10 cmu

得到线程时间, 其中最占CPU的是 EpollRecvTask 21581

ps -eL |grep 21465
21465 21579 pts/5 00:00:00 CamApp
21465 21580 pts/5 00:00:00 TimerMan Task
21465 21581 pts/5 00:09:02 EpollRecvTask
21465 21582 pts/5 00:00:00

使用 strace -p 21581 得到线程栈

转载于:https://www.cnblogs.com/sonic4x/archive/2011/06/17/How_to_deal_with_dead-loop_or_high-cpu_usage_bug.html

你可能感兴趣的文章
浅谈WPF中对控件的位图特效(虚化效果、外辉光效果)
查看>>
[翻译] TensorFlow Programmer's Guide之Frequently Asked Questions(问得频率最多的几个问题)...
查看>>
JavaWeb基础—会话管理之Cookie
查看>>
kettle学习笔记(六)——kettle转换步骤
查看>>
5、Node.js 回调函数
查看>>
由于启动用户实例的进程时出错,导致无法生成 SQL Server 的用户实例 解决办法...
查看>>
ActiveMQ之topic主题模式
查看>>
15 可视化工具 Navicat的简单使用
查看>>
神兵利器:Burpsuite工具分享与使用简介
查看>>
xml
查看>>
使用 Left Join 的一个错误说明
查看>>
[Java] Oracle的JDBC驱动的版本说明
查看>>
ASP.NET内置对象之Request对象
查看>>
Spring学习笔记5——注解方式AOP
查看>>
Scala入门系列(十一):模式匹配
查看>>
Sql Server 生成数据透视表 (行列转换等经典SQL语句)
查看>>
理解sizeof()
查看>>
Vue学习笔记之vue-cli脚手架安装和webpack-simple模板项目生成
查看>>
SqlServer 扩展属性
查看>>
优先队列
查看>>