java垃圾收集器_JVM垃圾收集器详解

作者：林志岳小行克元 | 来源：互联网 | 2024-10-11 12:51

说起垃圾收集(GarbageCollection，GC)，大部分人都把这项技术当做Java语言的伴生产物。事实上，GC的历史远比Java久

说起垃圾收集(Garbage Collection，GC)，大部分人都把这项技术当做Java语言的伴生产物。事实上，GC的历史远比Java久远，1960年诞生于MIT的Lisp是第一门真正使用内存动态分配和垃圾收集技术的语言。当List还在胚胎时期时，人们就在思考GC需要完成的3件事情：

哪些内存需要回收？

什么时候回收？

如何回收？

一、哪些内存需要回收？

从JVM区域结构看，可将这些区域划分为“静态内存”和“动态内存”两类。程序计数器、虚拟机栈、本地方法3个区域是“静态”的，因为这几个区域的内存分配和回收都具备确定性，都随着线程而生，随着线程而灭。但Java堆和方法区不一样，内存分配都存在不确定性，只有在程序处于运行期间才能知道会创建哪些对象，这部分内存和回收都是动态的，垃圾收集器所关注的是这部分内存。

在堆里面存放着Java世界几乎所有的对象实例，垃圾回收器在对堆进行回收前，第一件事情就是就是要确定这些对象哪些还"存活"着，哪些已经"死去"。那么又怎么确定对象已经"死去"呢？

1.引用计数法：

分配对象时给对象添加一个引用计数器，每当有一个地方引用它时，计数器值就加1；当引用失效时，计数器值就减1；任何时刻计数器为0的对象就是没有再被使用了。客观地说，引用计数法(Reference Counting)的实现简单，判断效率也很高，但是在主流的Java虚拟机里面没有选用引用计数法来管理内存，其中最主要的原因是它很难解决对象之间相互循环引用的问题。例如：

public class ReferenceCountingGC {

public Object instance = null;

private byte[] bigsize = new byte[2*1024*1024];

public static void testGC(){

ReferenceCountingGC objA = new ReferenceCountingGC();

ReferenceCountingGC objB = new ReferenceCountingGC();

objA.instance = objB;

objB.instance = objA;

objA = null;

objB = null;

System.gc();

}

当设置objA = null;objB = null后这两个对象再无任何引用，实际上这两个对象已经不可能再被访问，但是它们因为互相引用着对方，导致它们的引用计数都不为0，于是引用计数算法无法通知GC收集器回收它们。如果这个对象特别大，则会造成严重的内存泄露。

2.可达性分析算法：

可达性分析(Reachability Analysis)的基本思想是通过一系列的称为“GC Roots”的对象作为起始点，从这些节点开始向下搜索，搜索所走过的路径称为引用链(Reference Chain)，当一个对象到GC Roots没有任何引用链相连时(也就是GC Roots到这个对象不可达)，则证明此对象是不可用的。如下图所示：

对象Object5、Object6、Object7相互虽然有关联，但是它们到GC Roots是不可达的，所以它们将会被判定为是可回收的对象。在Java语言中，可作为GC Roots的对象包括下面几种：

虚拟机栈(栈帧中的本地变量表)中引用的对象。

方法区中类静态属性引用的对象。

方法区中常量引用的对象。

本地方法栈中JNI(即一般说的Native方法)引用的对象。

二、什么时候回收？

虚拟机为了分析GC Roots这项工作必须在一个能确保一致性的快照中进行，这里的“一致性”的意思就是指在整个分析期间整个执行系统看起来就像被冻结在某个时间点上——这叫安全点。当然，程序执行时并非在所有地方都能停顿下来开始GC，只有到达安全点时才能暂停。安全点选址也有规定的，选定基本上是以程序“是否具有让程序长时间执行的特征”为标准进行选定的。这里的长时间执行的最明显特征是指令列复用，例如方法调用、循环跳转、异常跳转等。

虚拟机为了能让所有线程都“跑”到安全点上停顿下来，设计了两个方案：抢先式中断和主动式中断。其中抢先式中断是虚拟机发生GC时，首先把所有线程全部中断，如果发生有线程中断的地方不在安全点上，就恢复线程，让它“跑”到安全点上。这种方式现在比较用了。而主动式中断是虚拟机需要GC时仅仅简单的设置一个标志，各个线程执行到安全点时主动去轮询这个标志，发现中断标志为真时就自己中断挂起。

三、如何回收？

3.1 垃圾收集算法:

(1)标记-清除(Mark-Sweep)算法

这是最基础的算法，就像它名字一样，算法分为“标记”和“清除”两个阶段：首先标记处所有需要回收的对象(如哪些内存需要回收所描述的对象)，对标记完成后统一回收所有被标记的对象，如下图所示：

缺点：一个是效率问题，标记和清除两个过程的效率都不高；另一个是空间问题，标记清除后悔产生大量的不连续的内存碎片，可能会导致后续无法分配大对象而导致再一次触发垃圾收集动作。

(2)复制算法

为了针对标记-清除算法的不足，复制算法将可用内存容量划分为大小相等的两块，每次只使用一块。当一块的内存用完了，就将还存活的对象复制到另一块上面去。然后把已使用过的内存空间一次清理掉，如下图所示：

缺点：使用内存比原来缩小了一半。

现在的商业虚拟机都采用这种收集算法来回收新生代，有企业分析的得出其实并不需求将内存按1:1的比例划分，因为新生代中的对象大部分都是“朝生夕死”的。所以，HotSpot虚拟机默认的Eden和Survivor的大小比例是8:1。一块Eden和两块Survivor，每次使用一块Eden和一块Survivor，也就是说只有10%是浪费的。如果另一块Survivor都无法存放上次垃圾回收的对象时，那这些对象将通过“担保机制”进入老年代了。

(3)标记-整理(Mark-Compact)算法

复制算法一般是对对象存活率较低的一种回收操作，但对于对象存活率较高的内存区域(老年代)来说，效果就不是那么理想了，标记-整理算法因此诞生了。标记-整理算法和标记-清除算法差不多，都是一开始对回收对象进行标记，但后续不是直接对对象清理，而是让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存，如下图所示：

(4)分代收集算法

分代收集算法是目前大部分JVM的垃圾收集器采用的算法。它的核心思想是根据对象存活的生命周期将内存划分为若干个不同的区域。一般情况下将堆区划分为老年代(Tenured Generation)和新生代(Young Generation)，老年代的特点是每次垃圾收集时只有少量对象需要被回收，而新生代的特点是每次垃圾回收时都有大量的对象需要被回收，那么就可以根据不同代的特点采取最适合的收集算法。

3.2 垃圾收集器：

(1)七种垃圾收集器:

Serial(串行GC)-复制

ParNew(并行GC)-复制

Parallel Scavenge(并行回收GC)-复制

Serial Old(MSC)(串行GC)-标记-整理

CMS(并发GC)-标记-清除

Parallel Old(并行GC)--标记-整理

G1(JDK1.7update14才可以正式商用)

说明：

1~3用于年轻代垃圾回收：年轻代的垃圾回收称为minor GC

4~6用于年老代垃圾回收(当然也可以用于方法区的回收)：年老代的垃圾回收称为full GC

G1独立完成"分代垃圾回收"

注意：并行与并发

并行：多条垃圾回收线程同时操作

并发：垃圾回收线程与用户线程一起操作

(2)常用五种组合:

Serial/Serial Old

ParNew/Serial Old：与上边相比，只是比年轻代多了多线程垃圾回收而已

ParNew/CMS：当下比较高效的组合

Parallel Scavenge/Parallel Old：自动管理的组合

G1：最先进的收集器，但是需要JDK1.7update14以上

(2.1)Serial/Serial Old：

特点：

年轻代Serial收集器采用单个GC线程实现"复制"算法(包括扫描、复制)

年老代Serial Old收集器采用单个GC线程实现"标记-整理"算法

Serial与Serial Old都会暂停所有用户线程(即STW)

说明：

STW(stop the world)：编译代码时为每一个方法注入safepoint(方法中循环结束的点、方法执行结束的点)，在暂停应用时，需要等待所有的用户线程进入safepoint，之后暂停所有线程，然后进行垃圾回收。

适用场合：

CPU核数<2，物理内存<2G的机器(简单来讲，单CPU，新生代空间较小且对STW时间要求不高的情况下使用)

-XX:UseSerialGC：强制使用该GC组合

-XX:PrintGCApplicationStoppedTime：查看STW时间

由于它实现相对简单，没有线程相关的额外开销(主要指线程切换与同步)，因此非常适合运行于客户端PC的小型应用程序，或者桌面应用程序(比如swing编写的用户界面程序)，以及我们平时的开发、调试、测试等。

(2.2)ParNew/Serial Old：

说明：

ParNew除了采用多GC线程来实现复制算法以外，其他都与Serial一样，但是此组合中的Serial Old又是一个单GC线程，所以该组合是一个比较尴尬的组合，在单CPU情况下没有Serial/Serial Old速度快(因为ParNew多线程需要切换)，在多CPU情况下又没有之后的三种组合快(因为Serial Old是单GC线程)，所以使用其实不多。

-XX:ParallelGCThreads：指定ParNew GC线程的数量，默认与CPU核数相同，该参数在于CMS GC组合时，也可能会用到

(2.3)Parallel Scavenge/Parallel Old：

特点：

年轻代Parallel Scavenge收集器采用多个GC线程实现"复制"算法(包括扫描、复制)

年老代Parallel Old收集器采用多个GC线程实现"标记-整理"算法

Parallel Scavenge与Parallel Old都会暂停所有用户线程(即STW)

说明：

吞吐量：CPU运行代码时间/(CPU运行代码时间+GC时间)

CMS主要注重STW的缩短(该时间越短，用户体验越好，所以主要用于处理很多的交互任务的情况)

Parallel Scavenge/Parallel Old主要注重吞吐量(吞吐量越大，说明CPU利用率越高，所以主要用于处理很多的CPU计算任务而用户交互任务较少的情况)

参数设置：

-XX:+UseParallelOldGC：使用该GC组合

-XX:GCTimeRatio：直接设置吞吐量大小，假设设为19，则允许的最大GC时间占总时间的1/(1 +19)，默认值为99，即1/(1+99)

-XX:MaxGCPauseMillis：最大GC停顿时间，该参数并非越小越好

-XX:+UseAdaptiveSizePolicy：开启该参数，-Xmn/-XX:SurvivorRatio/-XX:PretenureSizeThreshold这些参数就不起作用了，虚拟机会自动收集监控信息，动态调整这些参数以提供最合适的的停顿时间或者最大的吞吐量(GC自适应调节策略)，而我们需要设置的就是-Xmx，-XX:+UseParallelOldGC或-XX:GCTimeRatio两个参数就好(当然-Xms也指定上与-Xmx相同就好)

适用场合：

很多的CPU计算任务而用户交互任务较少的情况

不想自己去过多的关注GC参数，想让虚拟机自己进行调优工作

对吞吐量要求较高，或需要达到一定的量。

(2.4)ParNew/CMS：

说明：

以上只是年老代CMS收集的过程，年轻代ParNew看"2.2、ParNew/Serial Old"就好

CMS是多回收线程的，不要被上图误导，默认的线程数：(CPU数量+3)/4

CMS主要注重STW的缩短(该时间越短，用户体验越好，所以主要用于处理很多的交互任务的情况)

特点：

1.年轻代ParNew收集器采用多个GC线程实现"复制"算法(包括扫描、复制)

2.年老代CMS收集器采用多线程实现"标记-清除"算法

初始标记：标记与根集合节点直接关联的节点。时间非常短，需要STW

并发标记：遍历之前标记到的关联节点，继续向下标记所有存活节点。时间较长。

重新标记：重新遍历trace并发期间修改过的引用关系对象。时间介于初始标记与并发标记之间，通常不会很长。需要STW

并发清理：直接清除非存活对象，清理之后，将该线程占用的CPU切换给用户线程

3.初始标记与重新标记都会暂停所有用户线程(即STW)，但是时间较短；并发标记与并发清理时间较长，但是不需要STW

关于并发标记期间怎样记录发生变动的引用关系对象，在重新标记期间怎样扫描这些对象

缺点：

并发标记与并发清理：按照说明的第二点来讲，假设有2个CPU，那么其中有一个CPU会用于垃圾回收，而另一个用于用户线程，这样的话，之前是两CPU运行用户线程，现在是一个，那么效率就会急剧下降。也就是说，降低了吞吐量(即降低了CPU使用率)。

并发清理：在这一过程中，产生的垃圾无法被清理(因为发生在重新标记之后)

并发标记与并发清理：由于是与用户线程并发的，所以用户线程可能会分配对象，这样既可能对象直接进入年老代(例如，大对象)，也可能进入年轻代后，年轻代发生minor GC，这样的话，实际上要求我们的年老代需要预留一定空间，也就是说要在年老代还有一定空间的情况下就要进行垃圾回收，留出一定内存空间来供其他线程使用，而不能等到年老代快爆满了才进行垃圾回收，通过-XX:CMSInitiatingOccupancyFraction来指定当年老代空间满了多少后进行垃圾回收

标记-清理算法：会产生内存碎片，由于是在老年代，可能会提前触发Full GC(这正是我们要尽量减少的)

参数设置：

-XX:+UseConcMarkSweepGC：使用该GC组合

-XX:CMSInitiatingOccupancyFraction：指定当年老代空间满了多少后进行垃圾回收

-XX:+UseCMSCompactAtFullCollection：(默认是开启的)在CMS收集器顶不住要进行FullGC时开启内存碎片整理过程，该过程需要STW

-XX:CMSFullGCsBeforeCompaction：指定多少次FullGC后才进行整理

-XX:ParallelCMSThreads：指定CMS回收线程的数量，默认为：(CPU数量+3)/4

适用场合：

用于处理很多的交互任务的情况

方法区的回收一般使用CMS，配置两个参数：-XX:+CMSPermGenSweepingEnabled与-XX:+CMSClassUnloadingEnabled

适用于一些需要长期运行且对相应时间有一定要求的后台程序

(2.5)G1

说明：

从上图来看，G1与CMS相比，仅在最后的"筛选回收"部分不同(CMS是并发清除)，实际上G1回收器的整个堆内存的划分都与其他收集器不同。

CMS需要配合ParNew，G1可单独回收整个空间

原理：

G1收集器将整个堆划分为多个大小相等的Region

G1跟踪各个region里面的垃圾堆积的价值(回收后所获得的空间大小以及回收所需时间长短的经验值)，在后台维护一张优先列表，每次根据允许的收集时间，优先回收价值最大的region，这种思路：在指定的时间内，扫描部分最有价值的region(而不是扫描整个堆内存)，并回收，做到尽可能的在有限的时间内获取尽可能高的收集效率。

运作流程：

初始标记：标记出所有与根节点直接关联引用对象。需要STW

并发标记：遍历之前标记到的关联节点，继续向下标记所有存活节点。在此期间所有变化引用关系的对象，都会被记录在Remember Set Logs中

最终标记：标记在并发标记期间，新产生的垃圾。需要STW

筛选回收：根据用户指定的期望回收时间回收价值较大的对象(看"原理"第二条)。需要STW

优点：

停顿时间可以预测：我们指定时间，在指定时间内只回收部分价值最大的空间，而CMS需要扫描整个年老代，无法预测停顿时间

无内存碎片：垃圾回收后会整合空间，CMS采用"标记-清理"算法，存在内存碎片

筛选回收阶段：

由于只回收部分region，所以STW时间我们可控，所以不需要与用户线程并发争抢CPU资源，而CMS并发清理需要占据一部分的CPU，会降低吞吐量。

由于STW，所以不会产生"浮动垃圾"(即CMS在并发清理阶段产生的无法回收的垃圾)

适用范围：

追求STW短：若ParNew/CMS用的挺好，就用这个；若不符合，用G1

追求吞吐量：用Parallel Scavenge/Parallel Old，而G1在吞吐量方面没有优势

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，同时也希望多多支持脚本之家！

推荐阅读

string
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
string
阿里Java面试全解析：从技术面到HR面的详细攻略

本文作者分享了在阿里巴巴获得实习offer的经历，包括五轮面试的详细内容和经验总结。其中四轮为技术面试，一轮为HR面试，涵盖了大量的Java技术和项目实践经验。 ... [详细]

蜡笔小新 2024-12-23 11:32:02
string
2017-2018年度《网络编程与安全》第五次实验报告

本报告详细记录了2017-2018学年《网络编程与安全》课程第五次实验的具体内容、实验过程、遇到的问题及解决方案。 ... [详细]

蜡笔小新 2024-12-20 08:38:38
string
并发编程：深入理解设计原理与优化

本文探讨了并发编程中的关键设计原则，特别是Java内存模型（JMM）的happens-before规则及其对多线程编程的影响。文章详细介绍了DCL双重检查锁定模式的问题及解决方案，并总结了不同处理器和内存模型之间的关系，旨在为程序员提供更深入的理解和最佳实践。 ... [详细]

蜡笔小新 2024-12-26 01:14:06
string
深入解析Java虚拟机（JVM）架构与原理

本文旨在为读者提供对Java虚拟机（JVM）的全面理解，涵盖其主要组成部分、工作原理及其在不同平台上的实现。通过详细探讨JVM的结构和内部机制，帮助开发者更好地掌握Java编程的核心技术。 ... [详细]

蜡笔小新 2024-12-21 23:50:40
string
深入剖析JVM垃圾回收机制

本文详细探讨了Java虚拟机（JVM）中的垃圾回收机制，包括其意义、对象判定方法、引用类型、常见垃圾收集算法以及各种垃圾收集器的特点和工作原理。通过理解这些内容，开发人员可以更好地优化内存管理和程序性能。 ... [详细]

蜡笔小新 2024-12-20 17:24:41
string
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
string
Java多线程并发控制：解决相同key的线程互斥问题

本文探讨了在Java多线程环境下，如何确保具有相同key值的线程能够互斥执行并按顺序输出结果。通过优化代码结构和使用线程安全的数据结构，我们解决了线程同步问题，并实现了预期的并发行为。 ... [详细]

蜡笔小新 2024-12-25 14:15:29
string
深入理解Java多线程并发处理：基础与实践

本文探讨了Java中的多线程并发处理机制，从基本概念到实际应用，帮助读者全面理解并掌握多线程编程技巧。通过实例解析和理论阐述，确保初学者也能轻松入门。 ... [详细]

蜡笔小新 2024-12-20 19:28:45
go
深入解析JVM垃圾收集器

本文基于《深入理解Java虚拟机：JVM高级特性与最佳实践》第二版，详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景，帮助读者更好地理解和优化JVM内存管理。 ... [详细]

蜡笔小新 2024-12-28 13:35:19
range
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
version
Eclipse 开发环境配置与插件安装指南

本文详细介绍了如何准备和安装 Eclipse 开发环境及其相关插件，包括 JDK、Tomcat、Struts 等组件的安装步骤及配置方法。 ... [详细]

蜡笔小新 2024-12-24 19:47:22
string
深入理解Java字符串池机制

本文详细解析了Java中的字符串池（String Pool）机制，探讨其工作原理、实现方式及其对性能的影响。通过具体的代码示例和分析，帮助读者更好地理解和应用这一重要特性。 ... [详细]

蜡笔小新 2024-12-22 15:41:51
string
深入理解Java类加载机制与自定义类加载器

本文详细探讨了Java中的ClassLoader类加载器的工作原理，包括其如何将class文件加载至JVM中，以及JVM启动时的动态加载策略。文章还介绍了JVM内置的三种类加载器及其工作方式，并解释了类加载器的继承关系和双亲委托机制。 ... [详细]

蜡笔小新 2024-12-20 12:58:21
version
如何配置Java环境变量PATH以完成JDK安装

本文详细介绍了如何正确配置Java环境变量PATH，以确保JDK安装完成后能够正常运行。文章不仅涵盖了基本的环境变量设置步骤，还提供了针对不同操作系统下的具体操作指南。 ... [详细]

蜡笔小新 2024-12-19 20:15:05

林志岳小行克元

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章