最近,我一直在性能方面遇到困难,我在tomcat上运行的Java webapp会短暂挂起,导致积压的流量,这可能会使webapp在几分钟之内无法使用,我怀疑这与垃圾收集有关。
我是垃圾收集菜鸟,所以需要一些帮助。
我启用了并发标记扫描垃圾收集器,希望这将消除暂停,但是我还没有发现这是否已经解决了问题。
我还同时启用了详细的GC日志记录。
当前的Java选项如下
-XX:MaxPermSize=128m -XX:+CMSClassUnloadingEnabled -XX:+UseConcMarkSweepGC -Xms4g -Xmx4g -Xss256k -verbose:gc -XX:+PrintGCDetails
通过检查GC输出,我注意到年轻一代的空间非常低,只有243MB,并且很快就耗尽了,而在一段时间内检查输出时,我在10秒内计算了23个年轻一代的集合。
同时,堆的总消耗量稳定增加,接近最大值,然后进行完整的垃圾收集,将其从大约3.5gb减少到260mb,然后该模式再次重复其自身。
具有完整GC的样品输出
[GC [ParNew: 232750K->12960K(249216K), 0.0160890 secs] 3836696K->3616934K(4166656K), 0.0162110 secs] [Times: user=0.12 sys=0.01, real=0.02 secs]
[GC [ParNew: 234528K->11391K(249216K), 0.0127970 secs] 3838502K->3615402K(4166656K), 0.0129370 secs] [Times: user=0.12 sys=0.00, real=0.01 secs]
[GC [ParNew: 232959K->10253K(249216K), 0.0097850 secs] 3836970K->3614841K(4166656K), 0.0098850 secs] [Times: user=0.11 sys=0.00, real=0.01 secs]
[GC [1 CMS-initial-mark: 3604588K(3917440K)] 3615964K(4166656K), 0.0096810 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]
[CMS-concurrent-mark: 0.196/0.196 secs] [Times: user=1.44 sys=0.03, real=0.20 secs]
[CMS-concurrent-preclean: 0.013/0.014 secs] [Times: user=0.04 sys=0.00, real=0.01 secs]
[GC [ParNew: 231821K->6718K(249216K), 0.0090430 secs] 3836409K->3611789K(4166656K), 0.0091460 secs] [Times: user=0.08 sys=0.01, real=0.01 secs]
[CMS-concurrent-abortable-preclean: 0.176/0.390 secs] [Times: user=0.97 sys=0.04, real=0.39 secs]
[GC[YG occupancy: 124723 K (249216 K)][Rescan (parallel) , 0.0698120 secs][weak refs processing, 0.0038070 secs][class unloading, 0.0170180 secs][scrub symbol & string tables, 0.0098050 secs] [1 CMS-remark: 3605071K(3917440K)] 3729794K(4166656K), 0.1070920 secs] [Times: user=0.78 sys=0.02, real=0.11 secs]
[GC [ParNew: 228286K->6428K(249216K), 0.0079910 secs] 3755282K->3534155K(4166656K), 0.0080720 secs] [Times: user=0.07 sys=0.00, real=0.01 secs]
[GC [ParNew: 227996K->6880K(249216K), 0.0085010 secs] 3332282K->3111216K(4166656K), 0.0085990 secs] [Times: user=0.08 sys=0.00, real=0.01 secs]
[GC [ParNew: 228448K->12440K(249216K), 0.0108230 secs] 2721177K->2505200K(4166656K), 0.0109290 secs] [Times: user=0.13 sys=0.00, real=0.01 secs]
[GC [ParNew: 234008K->8251K(249216K), 0.0073110 secs] 2358432K->2132792K(4166656K), 0.0074120 secs] [Times: user=0.07 sys=0.00, real=0.00 secs]
[GC [ParNew: 229819K->5170K(249216K), 0.0071920 secs] 2056138K->1831867K(4166656K), 0.0072880 secs] [Times: user=0.07 sys=0.01, real=0.01 secs]
[GC [ParNew: 226738K->11119K(249216K), 0.0106230 secs] 1589903K->1374447K(4166656K), 0.0107180 secs] [Times: user=0.11 sys=0.00, real=0.01 secs]
[GC [ParNew: 232687K->8624K(249216K), 0.0078450 secs] 1273082K->1049051K(4166656K), 0.0079440 secs] [Times: user=0.09 sys=0.00, real=0.01 secs]
[GC [ParNew: 230192K->10130K(249216K), 0.0083440 secs] 733461K->513411K(4166656K), 0.0084420 secs] [Times: user=0.11 sys=0.00, real=0.01 secs]
[GC [ParNew: 231698K->10655K(249216K), 0.0092440 secs] 544833K->323816K(4166656K), 0.0093450 secs] [Times: user=0.11 sys=0.00, real=0.01 secs]
[CMS-concurrent-sweep: 4.481/4.569 secs] [Times: user=13.24 sys=0.49, real=4.57 secs]
[CMS-concurrent-reset: 0.008/0.008 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]
[GC [ParNew: 232223K->9791K(249216K), 0.0095050 secs] 495665K->273758K(4166656K), 0.0096020 secs] [Times: user=0.11 sys=0.00, real=0.01 secs]
[GC [ParNew: 231359K->7434K(249216K), 0.0080890 secs] 495326K->271660K(4166656K), 0.0082230 secs] [Times: user=0.09 sys=0.00, real=0.01 secs]
[GC [ParNew: 229002K->5732K(249216K), 0.0053690 secs] 493228K->269993K(4166656K), 0.0054630 secs] [Times: user=0.06 sys=0.00, real=0.01 secs]
[GC [ParNew: 227300K->4017K(249216K), 0.0060080 secs] 491561K->268433K(4166656K), 0.0061010 secs] [Times: user=0.07 sys=0.00, real=0.00 secs]
我想了解这种模式是否正常,以及如何优化和改进thisC。
我已经读过关于增加年轻一代的大小,但是对垃圾回收不太熟悉,我不确定这是否是正确的方法。
看起来您的年轻一代太小了-频繁收集并不是真正的问题(这仅意味着您有一个占用大量内存的程序),但是将大量内存提升给下一代是有问题的。一些东西:
您是否有任何资源可以汇集,例如您可以使用ThreadPoolExecutor而不是创建新的Thread对象,还是可以合并数据库连接?这将减慢您的内存消耗-池化的资源将保留在您的成熟空间中,而您将不必在年轻空间中重新分配它们。
如果这不是一种选择,或者这不能减少您的成熟空间消耗,请增加年轻一代的人数。这样做的目的并不是要减少年轻一代的收藏数量(如果您将年轻一代的数量增加一倍,那么您会将收藏数量减少一半,但每个收藏的价格可能翻倍**,因此您一无所获) ,这样做的目的是让年轻的对象有更多的时间超出范围,以便不将其提升到成熟的空间。您要进行的比较是完整集合的频率-如果您增加了年轻代的大小后,完整集合的数量减少了,那么您就成功了,否则将您的年轻代大小减小到默认值。
**这并非严格如此,因为年轻一代的收集器是一个复制收集器-它将活动对象复制到成熟空间,然后清除年轻空间。这意味着收集器在时间上的运行与活动对象的数量成正比,而不在时间上与对象的总数成比例(如标记清除集合的情况)。理想情况下,通过增加年轻代的大小,您将减少活动对象的数量并加快收集时间,并减少成熟空间的消耗。
显而易见的东西已经汇集起来,所以那里没有运气。 我增加了年轻一代的人数,它的工作方式像您建议的那样。 次要收藏的频率大约减少了一半,但每个次要收藏的时间实际上并未增加。 现在,两次完整收藏之间的时间也更长了。
@murdoch,您可以在blog.ragozin.info/2011/06/中找到GC暂停的粗略模型