JVM调优案例分析与实战（1）：高性能硬件上的程序部署策略

作者：炫彩十字绣I_775 | 来源：互联网 | 2023-09-24 00:10

本JVM系列均来源于《深入理解Java虚拟机》一书中，摘抄在此以便学习，版权归该书作者所有。环境：一个15万PV天左右的在线文档类型网站最近更换了硬件系统，新系统硬件为4个CPU、

>本JVM系列均来源于《深入理解Java虚拟机》一书中，版权归该书作者所有。

>环境：一个15万PV/天左右的在线文档类型网站最近更换了硬件系统，新系统硬件为4个CPU、16GB物理内存、OS为64位CentOS5.4、Resin作为Web服务器。

>说明：整个服务暂时没有部署别的应用，所有硬件资源都可以提供给访问量并不算太大的网站使用。管理员为了尽量利用硬件资源选用了64位的JDK1.5，并通过-Xmx和-Xms参数将java堆固定在12GB。

>问题：使用一段时间后发现使用效果并不理想，网站经常不定期出现长时间没有响应的现象。

>排查：监控服务器运行状况后发现网站没有响应是由于GC停顿导致的，虚拟机运行在Server模式，默认使用吞吐量优先收集器，回收12GB的堆，一次Full
GC的停顿时间高达14s。并且由于程序设计的关系，访问文档时要把文档从磁盘提取到内存中，

导致内存中出现很多由文档序列化产生的大对象，这些大对象很多都进入了>老年代，没有在Minor
GC中清理掉。这种情况下即使有12GB的堆，内存也很块被消耗殆尽，由此导致每隔十几分钟出现十几秒的停顿。

>分析：先不延伸讨论程序代码问题，程序部署上主要问题显然是过大的堆内存进行回收时带来的长时间停顿。硬件升级前使用32位系统1.5GB的堆，用户只感到访问网站比较缓慢，但不会发生十分明显的停顿，因此才考虑升级硬件来提升程序效能，如果重新

>
缩小给java堆分配的内存，那么硬件上的投资就浪费了。

> >在高性能硬件上部署程序，目前主要有两种方式：1.通过64为JDK来使用大内存
2.使用若干个32位虚拟机建立逻辑集群来利用硬件资源

>
此案例中管理员采用了第一种部署方式。对于用户交互性强、对停顿时间敏感的系统，可以给Java虚拟机分配超大堆的前提是有把握把应用程序的Full
GC频率控制得足够低，至少要低到不会影响用户使用，譬如十几个小事乃至一天才出现一次Full GC，这样可以通过在深夜执行定时任务的方式触发Full
GC甚至自动重启服务器来将内存可用空间保持在一个稳定的水平。

>
控制Full
GC频率的关键是看应用中绝大多数对象能否符合“招生夕灭”的原则，即大多数对象的生存时间不应太长，尤其是不能产生批量的、长生存时间的大对象，这样才能保证老年代空间的稳定。

>
在大多数网站形式的应用里，主要对象的生存周期都应该是请求级或页面级的，回话级和全局级的长生命对象相对减少。只要代码写得合理，应当都能实现在超大堆中正常使用而没有Full
GC，这样的话，使用超大堆内存时，网站响应的速度才比较有保证。除此之外，如果读者计划使用64位JDK来管理大内存，还需要考虑下面可能面临的问题：

>
1.内存回收导致的长时间停顿

>
2.现阶段，64位JDK的性能测试结果普遍低于32位JDK。

>
3.需要保证程序足够稳定，因为这种应用要是产生堆溢出几乎无法产生>堆转储快照(因为要产生十几GB乃至更大的dump文件)，哪怕产生了快照也几乎无法进行分析。

>
4.相同的程序在64位JDK中消耗的内存一般比32位JDK大，这是由于指针膨胀及数据型对齐补白等因素导致的。

>
上面的问题听起来有点吓人，所以现价段不少管理员还是选择了第二种方式：使用若干个32位虚拟建立逻辑集群>来利用硬件资源。具体做法是在一台物理机器上启动多个应用服务器进程，给每个服务器进行分配不同的端口，然后在前端搭建一个负载均衡器，以反向代理的方式来分配访问请求。读者不需要太在意均衡器转发所消耗的性能，即使使用64位JDK，许多应用也不止有一台服务器，因此许多应用中前段的均衡器总是要存在的。

>>
考虑到一台物理机器上建立逻辑集群的目的仅仅是尽可能地利用硬件资源，并不需要关心状态保留、热转移之类的高可用性需求，也不需要保证每个虚拟机进程有绝对准确的均衡负载，因此使用无Session复制的亲合式集群是一个相当不错的选择。我们仅仅需呀保障集群具备亲和性，也就是均衡器按一定的规则算法(一般根据SessionID分配)将一个固定的用户请求永远分配到固定的一个集群节点进行处理即可，这样程序开发阶段就基本不用为集群环境做什么特别的考虑。

>>
当然，很少有没有缺点的方案，如果读者计划使用逻辑集群的方式来部署程序，可能会遇到下面的一些问题。

>>
1.尽量避免节点竞争全局资源，最典型的就是磁盘竞争，各个节点如果同时访问某个磁盘文件的话（尤其是并发写操作容易出现问题），很容易导致IO异常。

>>
2.很难最高效率地利用某些资源池，如连接池，一般都是在各个节点建立自己独立的连接池，这样有可能导致一些节点池满了而另外一些节点仍有较多空余。尽管可以使用集中式的JNDI，但这有一定的复杂性且可能带来额外的性能代价。

>>
3.各个节点仍然不可避免地受到32位的内存限制，在32位Windows平台中每个进程只能使用2GB的内存，考虑到堆以外的内存开销，堆一般最多只能开到1.5GB。在某些Linux，Unix系统(如Solaris)中，可以提升到3GB乃至接近4GB的内存，但32位

>>
中仍然受最高4GB(2^32)内存的限制。

>>
4.大量使用本地缓存（如大量使用HashMap所谓K/V缓存）的应用，在逻辑集群中会造成较大的内存浪费，因为每个逻辑节点上都有一份缓存，这时可以考虑把本地缓存改成集中式缓存

>>
介绍完这两种部署方式，再重新回到这个案例中，最后的部署方案调整为建立5个32位JDK的逻辑集群，每个进程按2GB内存计算(其中堆固定为1.5GB)，占用了10GB的内存。另外建立一个Apache服务作为前端均衡器代理访问门户。考虑到用户对响应较低，因此改为CMS收集器进行垃圾回收。部署方式调整后，服务再没有出现长时间停顿，速度比硬件升级前有较多提升。

推荐阅读

get
LDAP服务器配置与管理

本文介绍如何通过安装和配置SSSD服务来统一管理用户账户信息，并实现其他系统的登录调用。通过图形化交互界面配置LDAP服务器，确保用户账户信息的集中管理和安全访问。 ... [详细]

蜡笔小新 2024-11-13 18:19:52
get
SoundPool

如果应用程序经常播放密集、急促而又短暂的音效（如游戏音效）那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点：1)延时时间较长，且资源占用率高 ... [详细]

蜡笔小新 2024-11-13 16:47:19
get
ZooKeeper 入门指南

本文将详细介绍ZooKeeper的工作机制、特点、数据结构以及常见的应用场景，包括统一命名服务、统一配置管理、统一集群管理、服务器动态上下线和软负载均衡。 ... [详细]

蜡笔小新 2024-11-13 13:11:46
get
解决DNS服务器配置转发无法解析的问题

本文详细介绍了如何解决DNS服务器配置转发无法解析的问题，包括编辑主配置文件和重启域名服务的具体步骤。 ... [详细]

蜡笔小新 2024-11-13 02:41:19
get
支付平台异步风控系统架构设计

本文介绍了一种支付平台异步风控系统的架构模型，旨在为开发类似系统的工程师提供参考。 ... [详细]

蜡笔小新 2024-11-14 15:21:34
get
使用 Git Rebase -i 合并多个提交

在开发过程中，频繁的小改动往往会生成多个提交记录。为了保持代码仓库的整洁，我们可以使用 git rebase -i 命令将多个提交合并成一个。 ... [详细]

蜡笔小新 2024-11-14 15:11:03
get
MySQL 数据库连接方法

本文介绍了如何使用 MySQL 命令行工具连接到指定的数据库。 ... [详细]

蜡笔小新 2024-11-14 10:08:54
get
Java代码分层详解及其应用场景

本文详细介绍了Java代码分层的基本概念和常见分层模式，特别是MVC模式。同时探讨了不同项目需求下的分层策略，帮助读者更好地理解和应用Java分层思想。 ... [详细]

蜡笔小新 2024-11-13 17:03:49
get
网络爬虫的规范与限制

本文探讨了网络爬虫引发的问题及其解决方案，重点介绍了Robots协议的作用和使用方法，旨在为网络爬虫的合理使用提供指导。 ... [详细]

蜡笔小新 2024-11-13 15:45:41
get
AngularJS $compile 详解

本文介绍了 AngularJS 中的 $compile 服务及其用法，通过示例代码展示了如何使用 $compile 动态编译和链接 HTML 元素。 ... [详细]

蜡笔小新 2024-11-13 15:34:47
int
[c++基础]STL

cppfig15_10.cppincludeincludeusingnamespacestd;templatevoidprintVector(constvector&integer ... [详细]

蜡笔小新 2024-11-13 13:22:43
get
自动验证时页面显示问题的解决方法

在使用自动验证功能时，页面未能正确显示错误信息。通过使用 `dump($info->getError())` 可以帮助诊断和解决问题。 ... [详细]

蜡笔小新 2024-11-13 12:30:21
get
数字资产交易平台量化交易系统开发

数字资产量化交易通过大数据分析，以客观的方式制定交易决策，有效减少人为的主观判断和情绪影响。本文介绍了几种常见的数字资产量化交易策略，包括搬砖套利和趋势交易，并探讨了量化交易软件的开发前景。 ... [详细]

蜡笔小新 2024-11-12 21:49:55
get
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
get
自定义滚动条美化页面内容

当页面内容超出显示范围时，为了提升用户体验和页面美观，通常会添加滚动条。如果默认的浏览器滚动条无法满足设计需求，我们可以自定义一个符合要求的滚动条。本文将详细介绍自定义滚动条的实现过程。 ... [详细]

蜡笔小新 2024-11-12 17:12:24

炫彩十字绣I_775

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章