热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

线上服务CPU又100%啦?一键定位soeasy!

点击上方“方志朋”,选择“设为星标”回复”666“获取新整理的面试资料来源:my.oschina.netleejun2005blog1524687背景1

点击上方“方志朋”,选择“设为星标”

回复”666“获取新整理的面试资料

来源:my.oschina.net/leejun2005/blog/1524687

  • 背景

  • 1、java 正则表达式回溯造成 CPU 100%

  • 2、线程死锁,程序 hang 住

  • 3、免费实用的脚本工具大礼包

    • (1)show-duplicate-java-classes

    • (2)find-in-jars

    • (3)housemd pid [java_home]

    • (4)jvm pid

    • (5)greys[@IP:PORT]

    • (6)sjksjk --commands sjk --help


背景

经常做后端服务开发的同学,或多或少都遇到过 CPU 负载特别高的问题。尤其是在周末或大半夜,突然群里有人反馈线上机器负载特别高,不熟悉定位流程和思路的同学可能登上服务器一通手忙脚乱,定位过程百转千回。

img

对此,也有不少同学曾经整理过相关流程或方法论,类似把大象放进冰箱要几步,传统的方案一般是4步:

1. top oder by with P:1040 // 首先按进程负载排序找到  axLoad(pid)
2. top -Hp 进程PID:1073    // 找到相关负载 线程PID
3. printf “0x%x\n”线程PID: 0x431  // 将线程PID转换为 16进制,为后面查找 jstack 日志做准备
4. jstack  进程PID | vim +/十六进制线程PID -        // 例如:jstack 1040|vim +/0x431 -

但是对于线上问题定位来说,分秒必争,上面的 4 步还是太繁琐耗时了,有没有可能封装成为一个工具,在有问题的时候一键定位,秒级找到有问题的代码行呢?

当然可以!工具链的成熟与否不仅体现了一个开发者的运维能力,也体现了开发者的效率意识。淘宝的oldratlee 同学就将上面的流程封装为了一个工具:show-busy-java-threads.sh(https://github.com/oldratlee/useful-scripts),可以很方便的定位线上的这类问题,下面我会举两个例子来看实际的效果。

快速安装使用:

source <(curl -fsSL https://raw.githubusercontent.com/oldratlee/useful-scripts/master/test-cases/self-installer.sh)

1、java 正则表达式回溯造成 CPU 100%

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class RegexLoad {public static void main(String[] args) {String[] patternMatch &#61; {"([\\w\\s]&#43;)&#43;([&#43;\\-/*])&#43;([\\w\\s]&#43;)","([\\w\\s]&#43;)&#43;([&#43;\\-/*])&#43;([\\w\\s]&#43;)&#43;([&#43;\\-/*])&#43;([\\w\\s]&#43;)"};List patternList &#61; new ArrayList();patternList.add("Avg Volume Units product A &#43; Volume Units product A");patternList.add("Avg Volume Units /  Volume Units product A");patternList.add("Avg retailer On Hand / Volume Units Plan / Store Count");patternList.add("Avg Hand Volume Units Plan Store Count");patternList.add("1 - Avg merchant Volume Units");patternList.add("Total retailer shipment Count");for (String s :patternList ){for(int i&#61;0;i}

编译、运行上述代码之后&#xff0c;咱们就能观察到服务器多了一个 100% CPU 的 java 进程&#xff1a;

img

怎么使用呢&#xff1f;

show-busy-java-threads.sh
# 从 所有的 Java进程中找出最消耗CPU的线程&#xff08;缺省5个&#xff09;&#xff0c;打印出其线程栈。show-busy-java-threads.sh -c <要显示的线程栈数>show-busy-java-threads.sh -c <要显示的线程栈数> -p <指定的Java Process>
# -F选项&#xff1a;执行jstack命令时加上-F选项&#xff08;强制jstack&#xff09;&#xff0c;一般情况不需要使用
show-busy-java-threads.sh -p <指定的Java Process> -Fshow-busy-java-threads.sh -s <指定jstack命令的全路径>
# 对于sudo方式的运行&#xff0c;JAVA_HOME环境变量不能传递给root&#xff0c;
# 而root用户往往没有配置JAVA_HOME且不方便配置&#xff0c;
# 显式指定jstack命令的路径就反而显得更方便了show-busy-java-threads.sh -a <输出记录到的文件>show-busy-java-threads.sh -t <重复执行的次数> -i <重复执行的间隔秒数>
# 缺省执行一次&#xff1b;执行间隔缺省是3秒##############################
# 注意&#xff1a;
##############################
# 如果Java进程的用户 与 执行脚本的当前用户 不同&#xff0c;则jstack不了这个Java进程。
# 为了能切换到Java进程的用户&#xff0c;需要加sudo来执行&#xff0c;即可以解决&#xff1a;
sudo show-busy-java-threads.sh

示例&#xff1a;

work&#64;dev_zz_Master 10.48.186.32 23:45:50 ~/demo >
bash show-busy-java-threads.sh
[1] Busy(96.2%) thread(8577/0x2181) stack of java process(8576) under user(work):
"main" prio&#61;10 tid&#61;0x00007f0c64006800 nid&#61;0x2181 runnable [0x00007f0c6a64a000]java.lang.Thread.State: RUNNABLEat java.util.regex.Pattern$GroupHead.match(Pattern.java:4168)at java.util.regex.Pattern$Loop.match(Pattern.java:4295)...at java.util.regex.Matcher.match(Matcher.java:1127)at java.util.regex.Matcher.matches(Matcher.java:502)at RegexLoad.main(RegexLoad.java:27)[2] Busy(1.5%) thread(8591/0x218f) stack of java process(8576) under user(work):
"C2 CompilerThread1" daemon prio&#61;10 tid&#61;0x00007f0c64095800 nid&#61;0x218f waiting on condition [0x0000000000000000]java.lang.Thread.State: RUNNABLE[3] Busy(0.8%) thread(8590/0x218e) stack of java process(8576) under user(work):
"C2 CompilerThread0" daemon prio&#61;10 tid&#61;0x00007f0c64093000 nid&#61;0x218e waiting on condition [0x0000000000000000]java.lang.Thread.State: RUNNABLE[4] Busy(0.2%) thread(8593/0x2191) stack of java process(8576) under user(work):
"VM Periodic Task Thread" prio&#61;10 tid&#61;0x00007f0c640a2800 nid&#61;0x2191 waiting on condition[5] Busy(0.1%) thread(25159/0x6247) stack of java process(25137) under user(work):
"VM Periodic Task Thread" prio&#61;10 tid&#61;0x00007f13340b4000 nid&#61;0x6247 waiting on condition
work&#64;dev_zz_Master 10.48.186.32 23:46:04 ~/demo >

可以看到&#xff0c;一键直接定位异常代码行&#xff0c;是不是很方便&#xff1f;

2、线程死锁&#xff0c;程序 hang 住

import java.util.*;
public class SimpleDeadLock extends Thread {public static Object l1 &#61; new Object();public static Object l2 &#61; new Object();private int index;public static void main(String[] a) {Thread t1 &#61; new Thread1();Thread t2 &#61; new Thread2();t1.start();t2.start();}private static class Thread1 extends Thread {public void run() {synchronized (l1) {System.out.println("Thread 1: Holding lock 1...");try { Thread.sleep(10); }catch (InterruptedException e) {}System.out.println("Thread 1: Waiting for lock 2...");synchronized (l2) {System.out.println("Thread 2: Holding lock 1 & 2...");}}}}private static class Thread2 extends Thread {public void run() {synchronized (l2) {System.out.println("Thread 2: Holding lock 2...");try { Thread.sleep(10); }catch (InterruptedException e) {}System.out.println("Thread 2: Waiting for lock 1...");synchronized (l1) {System.out.println("Thread 2: Holding lock 2 & 1...");}}}}
}

执行之后的效果&#xff1a;

img

如何用工具定位&#xff1a;

img

一键定位&#xff1a;可以清晰的看到线程互相锁住了对方等待的资源&#xff0c;导致死锁&#xff0c;直接定位到代码行和具体原因。

通过上面两个例子&#xff0c;我想各位同学应该对这个工具和工具能解决什么问题有了比较深刻的了解了&#xff0c;遇到 CPU 100% 问题可以从此不再慌乱。但是更多的还是依赖大家自己去实践&#xff0c;毕竟实践出真知嘛~

3、免费实用的脚本工具大礼包

除了正文提到的 show-busy-java-threads.sh&#xff0c;oldratlee 同学还整合和不少常见的开发、运维过程中涉及到的脚本工具&#xff0c;觉得特别有用的我简单列下&#xff1a;

&#xff08;1&#xff09;show-duplicate-java-classes

偶尔会遇到本地开发、测试都正常&#xff0c;上线后却莫名其妙的 class 异常&#xff0c;历经千辛万苦找到的原因竟然是 Jar冲突&#xff01;这个工具就可以找出Java Lib&#xff08;Java库&#xff0c;即Jar文件&#xff09;或Class目录&#xff08;类目录&#xff09;中的重复类。

Java开发的一个麻烦的问题是Jar冲突&#xff08;即多个版本的Jar&#xff09;&#xff0c;或者说重复类。会出NoSuchMethod等的问题&#xff0c;还不见得当时出问题。找出有重复类的Jar&#xff0c;可以防患未然。

# 查找当前目录下所有Jar中的重复类
show-duplicate-java-classes# 查找多个指定目录下所有Jar中的重复类
show-duplicate-java-classes path/to/lib_dir1 /path/to/lib_dir2# 查找多个指定Class目录下的重复类。Class目录 通过 -c 选项指定
show-duplicate-java-classes -c path/to/class_dir1 -c /path/to/class_dir2# 查找指定Class目录和指定目录下所有Jar中的重复类的Jar
show-duplicate-java-classes path/to/lib_dir1 /path/to/lib_dir2 -c path/to/class_dir1 -c path/to/class_dir2

例如&#xff1a;

# 在war模块目录下执行&#xff0c;生成war文件
$ mvn install
...
# 解压war文件&#xff0c;war文件中包含了应用的依赖的Jar文件
$ unzip target/*.war -d target/war
...
# 检查重复类
$ show-duplicate-java-classes -c target/war/WEB-INF/classes target/war/WEB-INF/lib
...

&#xff08;2&#xff09;find-in-jars

在当前目录下所有jar文件里&#xff0c;查找类或资源文件。

用法&#xff1a;注意&#xff0c;后面Pattern是grep的 扩展正则表达式。

find-in-jars &#39;log4j\.properties&#39;
find-in-jars &#39;log4j\.xml$&#39; -d /path/to/find/directory
find-in-jars log4j\\.xml
find-in-jars &#39;log4j\.properties|log4j\.xml&#39;

示例&#xff1a;

$ ./find-in-jars &#39;Service.class$&#39;
./WEB-INF/libs/spring-2.5.6.SEC03.jar!org/springframework/stereotype/Service.class
./rpc-benchmark-0.0.1-SNAPSHOT.jar!com/taobao/rpc/benchmark/service/HelloService.class

&#xff08;3&#xff09;housemd pid [java_home]

很早的时候&#xff0c;我们使用BTrace排查问题&#xff0c;在感叹BTrace的强大之余&#xff0c;也曾好几次将线上系统折腾挂掉。2012年淘宝的聚石写了HouseMD&#xff0c;将常用的几个Btrace脚本整合在一起形成一个独立风格的应用&#xff0c;其核心代码用的是Scala&#xff0c;HouseMD是基于字节码技术的诊断工具, 因此除了Java以外, 任何最终以字节码形式运行于JVM之上的语言, HouseMD都支持对它们进行诊断, 如Clojure(感谢&#64;Killme2008提供了它的使用入门), scala, Groovy, JRuby, Jython, kotlin等.

使用housemd对java程序进行运行时跟踪&#xff0c;支持的操作有&#xff1a;

  • 查看加载类

  • 跟踪方法

  • 查看环境变量

  • 查看对象属性值

  • 详细信息请参考: https://github.com/CSUG/HouseMD/wiki/UserGuideCN

&#xff08;4&#xff09;jvm pid

执行jvm debug工具&#xff0c;包含对java栈、堆、线程、gc等状态的查看&#xff0c;支持的功能有&#xff1a;

&#61;&#61;&#61;&#61;&#61;&#61;&#61;&#61;线程相关&#61;&#61;&#61;&#61;&#61;&#61;&#61;
1 : 查看占用cpu最高的线程情况
2 : 打印所有线程
3 : 打印线程数
4 : 按线程状态统计线程数
&#61;&#61;&#61;&#61;&#61;&#61;&#61;&#61;GC相关&#61;&#61;&#61;&#61;&#61;&#61;&#61;
5 : 垃圾收集统计&#xff08;包含原因&#xff09;可以指定间隔时间及执行次数&#xff0c;默认1秒, 10次
6 : 显示堆中各代的空间可以指定间隔时间及执行次数&#xff0c;默认1秒&#xff0c;5次
7 : 垃圾收集统计。可以指定间隔时间及执行次数&#xff0c;默认1秒, 10次
8 : 打印perm区内存情况*会使程序暂停响应*
9 : 查看directbuffer情况
&#61;&#61;&#61;&#61;&#61;&#61;&#61;&#61;堆对象相关&#61;&#61;&#61;&#61;&#61;&#61;&#61;
10 : dump heap到文件*会使程序暂停响应*默认保存到&#96;pwd&#96;/dump.bin,可指定其它路径
11 : 触发full gc。*会使程序暂停响应*
12 : 打印jvm heap统计*会使程序暂停响应*
13 : 打印jvm heap中top20的对象。*会使程序暂停响应*参数&#xff1a;1:按实例数量排序,2:按内存占用排序&#xff0c;默认为1
14 : 触发full gc后打印jvm heap中top20的对象。*会使程序暂停响应*参数&#xff1a;1:按实例数量排序,2:按内存占用排序&#xff0c;默认为1
15 : 输出所有类装载器在perm里产生的对象。可以指定间隔时间及执行次数
&#61;&#61;&#61;&#61;&#61;&#61;&#61;&#61;其它&#61;&#61;&#61;&#61;&#61;&#61;&#61;
16 : 打印finalzer队列情况
17 : 显示classloader统计
18 : 显示jit编译统计
19 : 死锁检测
20 : 等待X秒&#xff0c;默认为1
q : exit

进入jvm工具后可以输入序号执行对应命令
可以一次执行多个命令&#xff0c;用分号";"分隔&#xff0c;如&#xff1a;1;3;4;5;6
每个命令可以带参数&#xff0c;用冒号":"分隔&#xff0c;同一命令的参数之间用逗号分隔&#xff0c;如&#xff1a;

Enter command queue:1;5:1000,100;10:/data1/output.bin

&#xff08;5&#xff09;greys[&#64;IP:PORT]

PS&#xff1a;目前Greys仅支持Linux/Unix/Mac上的Java6&#43;&#xff0c;Windows暂时无法支持

Greys是一个JVM进程执行过程中的异常诊断工具&#xff0c;可以在不中断程序执行的情况下轻松完成问题排查工作。和HouseMD一样&#xff0c;Greys-Anatomy取名同名美剧“实习医生格蕾”&#xff0c;目的是向前辈致敬。代码编写的时候参考了BTrace和HouseMD两个前辈的思路。

使用greys对java程序进行运行时跟踪(不传参数&#xff0c;需要先greys -C pid,再greys)。支持的操作有&#xff1a;

  • 查看加载类&#xff0c;方法信息

  • 查看JVM当前基础信息

  • 方法执行监控&#xff08;调用量&#xff0c;失败率&#xff0c;响应时间等&#xff09;

  • 方法执行数据观测、记录与回放&#xff08;参数&#xff0c;返回结果&#xff0c;异常信息等&#xff09;

  • 方法调用追踪渲染

  • 详细信息请参考: https://github.com/oldmanpushcart/greys-anatomy/wiki

&#xff08;6&#xff09;sjksjk --commands sjk --help

使用sjk对Java诊断、性能排查、优化工具

  • ttop:监控指定jvm进程的各个线程的cpu使用情况

  • jps: 强化版

  • hh: jmap -histo强化版

  • gc: 实时报告垃圾回收信息

  • 更多信息请参考: https://github.com/aragozin/jvm-tools

热门内容&#xff1a;   

  • GitHub 上有个沙雕开发者&#xff0c;做了款斗图工具后火了...

  • 大白话带你认识Kafka

  • 如何参与一个顶级开源项目    

  • 深入理解 Spring Cloud 核心组件与底层原理

  • 最强 Java Redis 客户端

  • 微服务 2.0 技术栈选型手册

  • 为什么魂斗罗只有128KB却可以实现那么长的剧情&#xff1f;

  • IDEA高级用法&#xff1a;集成JIRA、UML类图插件、SSH、FTP、Database管理...


最近面试BAT&#xff0c;整理一份面试资料《Java面试BAT通关手册》&#xff0c;覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。

获取方式&#xff1a;点“在看”&#xff0c;关注公众号并回复 666 领取&#xff0c;更多内容陆续奉上。

明天见(&#xff61;&#xff65;ω&#xff65;&#xff61;)&#xff89;♡



推荐阅读
  • Maven Web项目创建时JSP文件常见错误及解决方案
    Maven Web项目创建时JSP文件常见错误及解决方案 ... [详细]
  • MicrosoftDeploymentToolkit2010部署培训实验手册V1.0目录实验环境说明3实验环境虚拟机使用信息3注意:4实验手册正文说 ... [详细]
  • 本文最初发表在Thorben Janssen的Java EE博客上,每周都会分享最新的Java新闻和动态。 ... [详细]
  • 在JavaWeb开发中,文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件,都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件,该库提供了强大的文件解析和存储能力,能够高效地处理各种文件类型。此外,为了提高系统的安全性和稳定性,还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]
  • Python 伦理黑客技术:深入探讨后门攻击(第三部分)
    在《Python 伦理黑客技术:深入探讨后门攻击(第三部分)》中,作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流,难以确定消息批次的结束点,这给后门攻击的实现带来了挑战。为了解决这一问题,文章提出了一系列有效的技术方案,包括使用特定的分隔符和长度前缀,以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性,还为安全研究人员提供了宝贵的参考。 ... [详细]
  • 本指南详细介绍了如何在CentOS 6.6 64位系统上以root用户身份部署Tomcat 8服务器。系统环境为CentOS 6.6 64位,采用源码安装方式。所需软件为apache-tomcat-8.0.23.tar.gz,建议将软件下载至/root/opt目录。具体下载地址请参见官方资源。本指南涵盖了从环境准备到服务启动的完整步骤,适用于需要在该系统环境下搭建高性能Web应用服务器的技术人员。 ... [详细]
  • Amoeba 通过优化 MySQL 的读写分离功能显著提升了数据库性能。作为一款基于 MySQL 协议的代理工具,Amoeba 能够高效地处理应用程序的请求,并根据预设的规则将 SQL 请求智能地分配到不同的数据库实例,从而实现负载均衡和高可用性。该方案不仅提高了系统的并发处理能力,还有效减少了主数据库的负担,确保了数据的一致性和可靠性。 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • 微软推出Windows Terminal Preview v0.10
    微软近期发布了Windows Terminal Preview v0.10,用户可以在微软商店或GitHub上获取这一更新。该版本在2月份发布的v0.9基础上,新增了鼠标输入和复制Pane等功能。 ... [详细]
  • 本文介绍了如何利用HTTP隧道技术在受限网络环境中绕过IDS和防火墙等安全设备,实现RDP端口的暴力破解攻击。文章详细描述了部署过程、攻击实施及流量分析,旨在提升网络安全意识。 ... [详细]
  • 秒建一个后台管理系统?用这5个开源免费的Java项目就够了
    秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ... [详细]
  • 2021年Java开发实战:当前时间戳转换方法详解与实用网址推荐
    在当前的就业市场中,金九银十过后,金三银四也即将到来。本文将分享一些实用的面试技巧和题目,特别是针对正在寻找新工作机会的Java开发者。作者在准备字节跳动的面试过程中积累了丰富的经验,并成功获得了Offer。文中详细介绍了如何将当前时间戳进行转换的方法,并推荐了一些实用的在线资源,帮助读者更好地应对技术面试。 ... [详细]
  • 在Java Web服务开发中,Apache CXF 和 Axis2 是两个广泛使用的框架。CXF 由于其与 Spring 框架的无缝集成能力,以及更简便的部署方式,成为了许多开发者的首选。本文将详细介绍如何使用 CXF 框架进行 Web 服务的开发,包括环境搭建、服务发布和客户端调用等关键步骤,为开发者提供一个全面的实践指南。 ... [详细]
  • 将Jar包部署至Linux服务器的详细步骤与注意事项
    将Jar包部署至Linux服务器的详细步骤及注意事项包括:首先使用 `mvn install` 命令进行Jar包的打包构建。接着,需要停止当前正在运行的Jar进程,可以通过 `ps -ef | grep **.jar` 查找对应的进程ID(PID),然后使用 `kill -9 ` 终止该进程。最后,使用 `rm` 命令删除旧的Jar包文件,确保新版本能够顺利部署。在整个过程中,务必确保操作的准确性和安全性,避免对服务器造成不必要的影响。 ... [详细]
  • C++ 开发实战:实用技巧与经验分享
    C++ 开发实战:实用技巧与经验分享 ... [详细]
author-avatar
秋凉凉_e1998
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有