当前位置: 开发笔记 > 编程语言 > 正文

1、cpu平均负载和cpu使用率排查cpu使用高问题

作者：低调的小男2502928607 | 来源：互联网 | 2023-09-04 16:38

自定义标题1.CPU2.CPU使用率3.测试：4.总结1.CPUcpu平均负载uptime或top查看cpu平均负载（平均负载是指单位时间内ÿ

自定义标题

- 1. CPU
- 2. CPU 使用率
- 3. 测试&＃xff1a;
- 4. 总结

1. CPU

cpu平均负载
uptime 或 top 查看 cpu 平均负载&＃xff08;平均负载是指单位时间内&＃xff0c;系统处于可运行状态和不可中断状态的平均进程数&＃xff0c;也就是平均活跃进程数&＃xff0c;&＃xff0c;它和 CPU 使用率并没有直接关系&＃xff09;

$ uptime 02:34:03 up 2 days, 20:14, 1 user, load average: 0.63, 0.83, 0.88 当前时间运行时间正在登录用户数 1min 5min 15min

查看逻辑CPU个数 &＃xff08;当平均负载高于 CPU 数量 70% 的时候&＃xff09;

grep &＃39;model name&＃39; /proc/cpuinfo | wc -l 逻辑CPU个数

平均负载其实就是平均活跃进程数&＃xff0c;那么最理想的&＃xff0c;就是每个 CPU 上都刚好运行着一个进程&＃xff0c;有了 CPU 个数&＃xff0c;我们就可以判断出&＃xff0c;当平均负载比 CPU 个数还大的时候&＃xff0c;系统已经出现了过载。
如果 1 分钟、5 分钟、15 分钟的三个值基本相同&＃xff0c;或者相差不大&＃xff0c;那就说明系统负载很平稳。
但如果 1 分钟的值远小于 15 分钟的值&＃xff0c;就说明系统最近 1 分钟的负载在减少&＃xff0c;而过去 15 分钟内却有很大的负载。
反过来&＃xff0c;如果 1 分钟的值远大于 15 分钟的值&＃xff0c;就说明最近 1 分钟的负载在增加&＃xff0c;这种增加有可能只是临时性的&＃xff0c;也有可能还会持续增加下去&＃xff0c;所以就需要持续观察。一旦 1 分钟的平均负载接近或超过了 CPU 的个数&＃xff0c;就意味着系统正在发生过载的问题&＃xff0c;这时就得分析调查是哪里导致的问题&＃xff0c;并要想办法优化了
假设我们在一个单 CPU 系统上看到平均负载为 1.73&＃xff0c;0.60&＃xff0c;7.98&＃xff0c;那么说明在过去 1 分钟内&＃xff0c;系统有 73% 的超载&＃xff0c;而在 15 分钟内&＃xff0c;有 698% 的超载&＃xff0c;从整体趋势来看&＃xff0c;系统的负载在降低。

2. CPU 使用率

平均负载是指单位时间内&＃xff0c;处于可运行状态和不可中断状态的进程数。所以&＃xff0c;它不仅包括了正在使用 CPU 的进程&＃xff0c;还包括等待 CPU 和等待 I/O 的进程。
而 CPU 使用率&＃xff0c;是单位时间内 CPU 繁忙情况的统计&＃xff0c;跟平均负载并不一定完全对应。比如&＃xff1a;
CPU 密集型进程&＃xff0c;使用大量 CPU 会导致平均负载升高&＃xff0c;此时这两者是一致的&＃xff1b;
I/O 密集型进程&＃xff0c;等待 I/O 也会导致平均负载升高&＃xff0c;但 CPU 使用率不一定很高&＃xff1b;
大量等待 CPU 的进程调度也会导致平均负载升高&＃xff0c;此时的 CPU 使用率也会比较高。

3. 测试&＃xff1a;

安装stress&＃xff08;Linux系统压力测试工具&＃xff09;和sysstat&＃xff08;Linux性能工具&＃xff09;&＃xff08;Centos7系统&＃xff09;
安装stress&＃xff08;Linux系统压力测试工具&＃xff09;和sysstat&＃xff08;Linux性能工具&＃xff09;
yum install stress 一直找不到镜像处理方式所以用了rpm方式安装
用rpm方式安装&＃xff0c;先从下面的地址下载rpm包
http://ftp.tu-chemnitz.de/pub/linux/dag/redhat/el7/en/x86_64/rpmforge/RPMS/stress-1.0.2-1.el7.rf.x86_64.rpm
然后 rpm -Uvh stress-1.0.2-1.el7.rf.x86_64.rpm 安装
sysstat使用yum安装 yum install sysstat

查看平均负载变化率 watch -d uptime

$ watch -d uptime ..., load average: 1.06, 0.58, 0.37

查看cpu使用率 mpstat -P ALL 5

显示所有CPU的指标&＃xff0c;并在间隔5秒输出一组数据 $ mpstat -P ALL 5 20 Linux 4.15.0 (ubuntu) 09/22/18 _x86_64_ (2 CPU) 13:41:28 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle 13:41:33 all 0.21 0.00 12.07 32.67 0.00 0.21 0.00 0.00 0.00 54.84 13:41:33 0 0.43 0.00 23.87 67.53 0.00 0.43 0.00 0.00 0.00 7.74 13:41:33 1 0.00 0.00 0.81 0.20 0.00 0.00 0.00 0.00 0.00 98.99

查看哪个进程占用cpu高 pidstat -u 5 1

# 间隔5秒后输出一组数据&＃xff0c;-u表示CPU指标 pidstat输出中没有%wait的问题&＃xff0c; 是因为CentOS默认的sysstat稍微有点老&＃xff0c;源码或者RPM升级到11.5.5版本以后就可以看到了 $ pidstat -u 5 1 Linux 4.15.0 (ubuntu) 09/22/18 _x86_64_ (2 CPU) 13:42:08 UID PID %usr %system %guest %wait %CPU CPU Command 13:42:13 0 104 0.00 3.39 0.00 0.00 3.39 1 kworker/1:1H 13:42:13 0 109 0.00 0.40 0.00 0.00 0.40 0 kworker/0:1H 13:42:13 0 2997 2.00 35.53 0.00 3.99 37.52 1 stress 13:42:13 0 3057 0.00 0.40 0.00 0.00 0.40 0 pidstat

平均负载高有可能是 CPU 密集型进程导致的&＃xff1b;
平均负载高并不一定代表 CPU 使用率高&＃xff0c;还有可能是 I/O 更繁忙了&＃xff1b;
当发现负载高的时候&＃xff0c;你可以使用 mpstat、pidstat 等工具&＃xff0c;辅助分析负载的来源。

4. 总结

一、什么是平均负载
正确定义&＃xff1a;单位时间内&＃xff0c;系统中处于可运行状态和不可中断状态的平均进程数。
错误定义&＃xff1a;单位时间内的cpu使用率。
可运行状态的进程&＃xff1a;正在使用cpu或者正在等待cpu的进程&＃xff0c;即ps aux命令下STAT处于R状态的进程
不可中断状态的进程&＃xff1a;处于内核态关键流程中的进程&＃xff0c;且不可被打断&＃xff0c;如等待硬件设备IO响应&＃xff0c;ps命令D状态的进程
理想状态&＃xff1a;每个cpu上都有一个活跃进程&＃xff0c;即平均负载数等于cpu数
过载经验值&＃xff1a;平均负载高于cpu数量70%的时候

二、相关命令
cpu核数: lscpu、 grep ‘model name’ /proc/cpuinfo | wc -l
显示平均负载&＃xff1a;uptime、top&＃xff0c;显示的顺序是最近1分钟、5分钟、15分钟&＃xff0c;从此可以看出平均负载的趋势
watch -d uptime: -d会高亮显示变化的区域
strees: 压测命令&＃xff0c;–cpu cpu压测选项&＃xff0c;-i io压测选项&＃xff0c;-c 进程数压测选项&＃xff0c;–timeout 执行时间
mpstat: 多核cpu性能分析工具&＃xff0c;-P ALL监视所有cpu
pidstat: 进程性能分析工具&＃xff0c;-u 显示cpu利用率

三、平均负载与cpu使用率的区别
CPU使用率&＃xff1a;单位时间内cpu繁忙情况的统计
情况1&＃xff1a;CPU密集型进程&＃xff0c;CPU使用率和平均负载基本一致
情况2&＃xff1a;IO密集型进程&＃xff0c;平均负载升高&＃xff0c;CPU使用率不一定升高
情况3&＃xff1a;大量等待CPU的进程调度&＃xff0c;平均负载升高&＃xff0c;CPU使用率也升高

四、平均负载过高时&＃xff0c;如何调优
工具&＃xff1a;stress、sysstat&＃xff0c;yum即可安装

CPU密集型进程case&＃xff1a;
mpstat -P ALL 5: -P ALL表示监控所有CPU&＃xff0c;5表示每5秒刷新一次数据&＃xff0c;观察是否有某个cpu的%usr会很高&＃xff0c;但iowait应很低
pidstat -u 5 1&＃xff1a;每5秒输出一组数据&＃xff0c;观察哪个进程%cpu很高&＃xff0c;但是%wait很低&＃xff0c;极有可能就是这个进程导致cpu飚高
IO密集型进程case&＃xff1a;
mpstat -P ALL 5: 观察是否有某个cpu的%iowait很高&＃xff0c;同时%usr也较高
pidstat -u 5 1&＃xff1a;观察哪个进程%wait较高&＃xff0c;同时%CPU也较高
大量进程case&＃xff1a;
pidstat -u 5 1&＃xff1a;观察那些%wait较高的进程是否有很多

推荐阅读

window
通过Anaconda安装tensorflow，并安装运行spyder编译器的完整教程

本文提供了一个完整的教程，介绍了如何通过Anaconda安装tensorflow，并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统，并提供了相关的网址供参考。通过本教程，读者可以轻松地安装和配置tensorflow环境，以及运行spyder编译器进行开发。 ... [详细]

蜡笔小新 2023-12-09 09:46:32
window
top命令使用方法及解读

本文介绍了top命令的使用方法和解读，包括查看进程信息、系统负载、内存状态、CPU占用等内容。通过top命令可以持续观察系统上运行的进程，并了解系统负载情况，及时关闭一些进程以减轻系统负担。同时，还介绍了top命令的快捷键和安全模式启动方法。通过本文的学习，读者可以更好地使用top命令来管理系统进程。 ... [详细]

蜡笔小新 2023-12-09 06:50:59
ip
Skywalking系列博客1安装单机版 Skywalking的快速安装方法

本文介绍了如何快速安装单机版的Skywalking，包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]

蜡笔小新 2023-12-14 19:05:47
ip
解决Mac上无法使用localhost连接mysql的问题

本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题，并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别，指出了使用socket方式连接导致连接失败的原因。此外，还提供了相关链接供读者深入了解。 ... [详细]

蜡笔小新 2023-12-13 17:48:58
ip
Webmin远程命令执行漏洞复现及防护方法

本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法，同时提供了防护方法。漏洞存在于Webmin的找回密码页面中，攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外，还指出了参考链接中的数据包不准确的问题，并解释了漏洞触发的条件。最后，给出了防护方法以避免受到该漏洞的攻击。 ... [详细]

蜡笔小新 2023-12-13 16:14:53
ip
Linux 正则表达式基础及使用注意事项

本文介绍了Linux系统中正则表达式的基础知识，包括正则表达式的简介、字符分类、普通字符和元字符的区别，以及在学习过程中需要注意的事项。同时提醒读者要注意正则表达式与通配符的区别，并给出了使用正则表达式时的一些建议。本文适合初学者了解Linux系统中的正则表达式，并提供了学习的参考资料。 ... [详细]

蜡笔小新 2023-12-13 14:24:45
ip
Linux如何安装Mongodb的详细步骤和注意事项

本文介绍了Linux如何安装Mongodb的详细步骤和注意事项，同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库，适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作，能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]

蜡笔小新 2023-12-12 21:54:15
ip
mysql升级（从5.6.15升级到5.7.15的步骤）

本文介绍了将mysql从5.6.15升级到5.7.15的详细步骤，包括关闭访问、备份旧库、备份权限、配置文件备份、关闭旧数据库、安装二进制、替换配置文件以及启动新数据库等操作。 ... [详细]

蜡笔小新 2023-12-12 14:45:04
process
使用集算器将日志文件结构化，轻松使用SQL查询

本文介绍了一种轻巧方便的工具——集算器，通过使用集算器可以将文本日志变成结构化数据，然后可以使用SQL式查询。集算器利用集算语言的优点，将日志内容结构化为数据表结构，SPL支持直接对结构化的文件进行SQL查询，不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]

蜡笔小新 2023-12-11 13:27:46
header
如何利用 Myflash 解析 binlog ?

本文主要介绍了对Myflash的测试，从准备测试环境到利用Myflash解析binl ... [详细]

蜡笔小新 2023-12-11 09:13:37
header
x265探索与研究（一）：x265下载安装与配置

本文记录了作者对x265开源代码的实现与框架进行学习与探索的过程，包括x265的下载地址与参考资料，以及在Win7 32 bit PC、VS2010平台上的安装与配置步骤。 ... [详细]

蜡笔小新 2023-12-10 14:05:27
ip
如何使用readlink获取文件的完整路径？

本文介绍了使用readlink命令获取文件的完整路径的简单方法，并提供了一个示例命令来打印文件的完整路径。共有28种解决方案可供选择。 ... [详细]

蜡笔小新 2023-12-09 17:28:17
ip
面试经验分享：华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试

最近有朋友去华为面试，面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败，因为缺乏基础知识。面试问题涉及 ... [详细]

蜡笔小新 2023-12-09 10:22:03
ip
在Windows10系统上使用VMware创建CentOS虚拟机的详细步骤教程

本文详细介绍了在Windows10系统上使用VMware创建CentOS虚拟机的步骤，包括准备条件、安装VMware、下载CentOS ISO文件、创建虚拟机并进行自定义配置、设置虚拟机的ISO与网络、进行安装和配置等。通过本文的指导，读者可以轻松地创建自己的CentOS虚拟机并进行相应的配置和操作。 ... [详细]

蜡笔小新 2023-12-09 09:09:21
ip
如何使用PLEX播放组播、抓取信号源以及设置路由器

本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源，用户可以在PLEX上实现直播功能，并且可以自动匹配EPG信息和定时录制节目。同时，本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前，建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后，本文还介绍了docker版xTeve的设置方法。 ... [详细]

蜡笔小新 2023-12-09 01:31:00

低调的小男2502928607

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章