GC垃圾回收机制以及垃圾回收算法

作者：docetaxel | 来源：互联网 | 2023-09-05 19:43

JavaGC垃圾回收几乎是面试必问的JVM问题之一，本篇文章带领大家了解JavaGC的底层原理，图文并茂，突破学习及面试瓶颈。楔子-JVM

Java GC垃圾回收几乎是面试必问的JVM问题之一&＃xff0c;本篇文章带领大家了解Java GC的底层原理&＃xff0c;图文并茂&＃xff0c;突破学习及面试瓶颈。

楔子-JVM内存结构补充

在上篇《JVM之内存结构详解》中有些内容我们没有讲&＃xff0c;本篇结合垃圾回收机制来一起学习。还记得JVM中堆的结构图吗&＃xff1f;

图中展示了堆中三个区域&＃xff1a;Eden、From Survivor、To Survivor。从图中可以也可以看到它们的大小比例&＃xff0c;准确来说是&＃xff1a;8:1:1。为什么要这样设计呢&＃xff0c;本篇文章后续会给出解答&＃xff0c;还是根据垃圾回收的具体情况来设计的。

还记得在设置JVM时&＃xff0c;常用的类似-Xms和-Xmx等参数吗&＃xff1f;对的它们就是用来说设置堆中各区域的大小的。

(图片来源于网络)

控制参数详解&＃xff1a;

-Xms设置堆的最小空间大小。
-Xmx设置堆的最大空间大小。
-Xmn堆中新生代初始及最大大小&＃xff08;NewSize和MaxNewSize为其细化&＃xff09;。
-XX:NewSize设置新生代最小空间大小。
-XX:MaxNewSize设置新生代最大空间大小。
-XX:PermSize设置永久代最小空间大小。
-XX:MaxPermSize设置永久代最大空间大小。
-Xss设置每个线程的堆栈大小。

对照上面两个图&＃xff0c;再来看这些参数是不是没有之前那么枯燥了&＃xff0c;它们在图中都有了对应的位置。

有没有发现没有直接设置老年代空间大小的参数&＃xff1f;我们通过简单的计算获得。

老年代空间大小&＃61;堆空间大小-年轻代大空间大小

对上面参数立即了&＃xff0c;但记忆有困难&＃xff1f;那么&＃xff0c;以下几个助记词可能更好的帮你记忆和理解参数的含义。

Xmx&＃xff08;memory maximum&＃xff09;, Xms&＃xff08;memory startup&＃xff09;, Xmn&＃xff08;memory nursery/new&＃xff09;, Xss&＃xff08;stack size&＃xff09;。

对于参数的格式可以这样理解&＃xff1a;

-: 标准VM选项&＃xff0c;VM规范的选项。
-X: 非标准VM选项&＃xff0c;不保证所有VM支持。
-XX: 高级选项&＃xff0c;高级特性&＃xff0c;但属于不稳定的选项。

GC概述

垃圾收集&＃xff08;Garbage Collection&＃xff09;通常被称为“GC”&＃xff0c;由虚拟机“自动化”完成垃圾回收工作。

思考一个问题&＃xff0c;既然GC会自动回收&＃xff0c;开发人员为什么要学习GC和内存分配呢&＃xff1f;为了能够配置上面的参数配置&＃xff1f;参数配置又是为了什么&＃xff1f;

“当需要排查各种内存溢出&＃xff0c;内存泄露问题时&＃xff0c;当垃圾成为系统达到更高并发量的瓶颈时&＃xff0c;我们就需要对GC的自动回收实施必要的监控和调节。”

JVM中程序计数器、虚拟机栈、本地方法栈3个区域随线程而生随线程而灭。栈帧随着方法的进入和退出做入栈和出栈操作&＃xff0c;实现了自动的内存清理。它们的内存分配和回收都具有确定性。

因此&＃xff0c;GC垃圾回收主要集中在堆和方法区&＃xff0c;在程序运行期间&＃xff0c;这部分内存的分配和使用都是动态的。

下面通过概念和具体的算法来了解GC垃圾回收的过程。

如何判断对象存活

判断对象常规有两种方法&＃xff1a;引用计数算法和可达性分析算法&＃xff08;Reachability Analysis&＃xff09;。

引用计数算法

给对象添加一个引用计数器&＃xff0c;每当有一个地方引用它时计数器加1&＃xff0c;引用释放时计数减1&＃xff0c;当计数器为0时可以回收。

引用计数算法实现简单&＃xff0c;判断高效&＃xff0c;在微软COM和Python语言等被广泛使用&＃xff0c;但在主流的Java虚拟机中没有使用该方法&＃xff0c;主要是因为无法解决对象相互循环引用的问题。

可达性分析算法

基本思想是通过一系列称为“GC Root”的对象&＃xff08;如系统类加载器、栈中的对象、处于激活状态的线程等&＃xff09;作为起点&＃xff0c;基于对象引用关系&＃xff0c;开始向下搜索&＃xff0c;所走过的路径称为引用链&＃xff0c;当一个对象到GC Root没有任何引用链相连&＃xff0c;证明对象是不可用的。

上图中中绿色部分为存活对象&＃xff0c;灰色部分为可回收对象。虽然灰色部分内部依旧有关联&＃xff0c;但它们到GC Root是不可达的。

面试问题

面试官&＃xff0c;说说Java GC都用了哪些算法&＃xff1f;分别应用在什么地方&＃xff1f;

答&＃xff1a;复制算法、标记清除、标记整理……

你还在单纯的死记硬背么&＃xff1f;继续往下看&＃xff0c;你会豁然开朗&＃xff0c;再也不用死记硬背了。

标记清除算法

标记清除&＃xff08;Mark-Sweep&＃xff09;算法&＃xff0c;包含“标记”和“清除”两个阶段&＃xff1a;首先标记出所有需要回收的对象&＃xff0c;在标记完成后统一回收掉所有被标记的对象。

标记清除算法是最基础的收集算法&＃xff0c;后续的收集算法都是基于该思路并对其缺点进行改进而得到的。

主要缺点&＃xff1a;一个是效率问题&＃xff0c;标记和清除过程的效率都不高&＃xff1b;另外是空间问题&＃xff0c;标记清除之后会产生大量不连续的内存碎片&＃xff0c;空间碎片太多可能会导致&＃xff0c;当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

复制算法

复制&＃xff08;Copying&＃xff09;算法&＃xff1a;将可用内存按容量划分为大小相等的两块&＃xff0c;每次只使用其中的一块。当一块内存用完了&＃xff0c;就将还存活着的对象复制到另外一块上&＃xff0c;然后清理掉前一块。

每次对半区内存回收时、内存分配时就不用考虑内存碎片等复杂情况&＃xff0c;只要移动堆顶指针&＃xff0c;按顺序分配内存即可&＃xff0c;实现简单&＃xff0c;运行高效。

缺点&＃xff1a;将内存缩小为一半&＃xff0c;性价比低&＃xff0c;持续复制长生存期的对象则导致效率低下。

JVM堆中新生代便采用复制算法。回到最初推分配结构图。

在GC回收过程中&＃xff0c;当Eden区满时&＃xff0c;还存活的对象会被复制到其中一个Survivor区&＃xff1b;当回收时&＃xff0c;会将Eden和使用的Survivor区还存活的对象&＃xff0c;复制到另外一个Survivor区&＃xff0c;然后对Eden和用过的Survivor区进行清理。

如果另外一个Survivor区没有足够的内存存储时&＃xff0c;则会进入老年代。

这里针对哪些对象会进入老年代有这样的机制&＃xff1a;对象每经历一次复制&＃xff0c;年龄加1&＃xff0c;达到晋升年龄阈值后&＃xff0c;转移到老年代。

在这整个过程中&＃xff0c;由于Eden中的对象属于像浮萍一样“瞬生瞬灭”的对象&＃xff0c;所以并不需要1&＃xff1a;1的比例来分配内存&＃xff0c;而是采用了8&＃xff1a;1&＃xff1a;1的比例来分配。

而针对那些像“水熊虫”一样&＃xff0c;历经多次清理依旧存活的对象&＃xff0c;则会进入老年代&＃xff0c;而老年的清理算法则采用下面要讲到的“标记整理算法”。

标记整理算法

标记整理&＃xff08;Mark-Compact&＃xff09;算法&＃xff1a;标记过程与“标记-清除”算法一样&＃xff0c;但后续步骤不是直接对可回收对象进行清理&＃xff0c;而是让所有存活的对象都向一端移动&＃xff0c;然后直接清理掉端边界以外的内存。

这种算法不既不用浪费50%的内存&＃xff0c;也解决了复制算法在对象存活率较高时的效率低下问题。

分代收集算法

分代收集算法&＃xff0c;基本思路&＃xff1a;将Java的堆内存逻辑上分成两块&＃xff0c;新生代和老年代&＃xff0c;针对不同存活周期、不同大小的对象采取不同的垃圾回收策略。

而在新生代中大多数对象都是瞬间对象&＃xff0c;只有少量对象存活&＃xff0c;复制较少对象即可完成清理&＃xff0c;因此采用复制算法。而针对老年代中的对象&＃xff0c;存活率较高&＃xff0c;又没有额外的担保内存&＃xff0c;因此采用标记整理算法。

其实&＃xff0c;回头看&＃xff0c;分代收集算法就是对新生代和老年代算法从策略维度的规划而已。

小结

至此&＃xff0c;当面试官再问Java GC都用到了哪些垃圾回收算法和分别应用在什么场景下的问题&＃xff0c;再也不用死记硬背了吧&＃xff1f;

关于Java GC还有垃圾收集器及垃圾回收调优&＃xff0c;我们将在后续文章中持续更新&＃xff0c;欢迎关注公众号“程序新视界”获得第一手更新。

推荐阅读

int
Java集合框架的使用方法与性能对比分析

本文详细探讨了Java集合框架的使用方法及其性能特点。首先，通过关系图展示了集合接口之间的层次结构，如`Collection`接口作为对象集合的基础，其下分为`List`、`Set`和`Queue`等子接口。其中，`List`接口支持按插入顺序保存元素且允许重复，而`Set`接口则确保元素唯一性。此外，文章还深入分析了不同集合类在实际应用中的性能表现，为开发者选择合适的集合类型提供了参考依据。 ... [详细]

蜡笔小新 2024-11-01 09:51:38
int
Java中高级工程师面试必备：JVM核心知识点全面解析

对于软件开发人员而言，随着技术框架的不断演进和成熟，许多高级功能已经被高度封装，使得初级开发者只需掌握基本用法即可迅速完成项目。然而，对于中高级工程师而言，深入了解Java虚拟机（JVM）的核心知识点是必不可少的。这不仅有助于优化性能和解决复杂问题，还能在面试中脱颖而出。本文将全面解析JVM的关键概念和技术细节，帮助读者全面提升技术水平。 ... [详细]

蜡笔小新 2024-10-31 10:20:42
int
JVM参数设置与命令行工具详解

JVM参数配置与命令行工具的深入解析旨在优化系统性能，通过合理设置JVM参数，确保在高吞吐量的前提下，有效减少垃圾回收（GC）的频率，进而降低系统停顿时间，提升服务的稳定性和响应速度。此外，本文还将详细介绍常用的JVM命令行工具，帮助开发者更好地监控和调优JVM运行状态。 ... [详细]

蜡笔小新 2024-10-30 15:49:34
int
基于POI的Java Maven项目中实现Excel数据的高效导入与导出功能

本项目在Java Maven框架下，利用POI库实现了Excel数据的高效导入与导出功能。通过优化数据处理流程，提升了数据操作的性能和稳定性。项目已发布至GitHub，当前最新版本为0.0.5。该项目不仅适用于小型应用，也可扩展用于大型企业级系统，提供了灵活的数据管理解决方案。GitHub地址：https://github.com/83945105/holygrail，Maven坐标：`com.github.83945105:holygrail:0.0.5`。 ... [详细]

蜡笔小新 2024-10-31 18:52:27
include
掌握PHP框架开发与应用的核心知识点：构建高效PHP框架所需的技术与能力综述

掌握PHP框架开发与应用的核心知识点对于构建高效PHP框架至关重要。本文综述了开发PHP框架所需的关键技术和能力，包括但不限于对PHP语言的深入理解、设计模式的应用、数据库操作、安全性措施以及性能优化等方面。对于初学者而言，熟悉主流框架如Laravel、Symfony等的实际应用场景，有助于更好地理解和掌握自定义框架开发的精髓。 ... [详细]

蜡笔小新 2024-10-31 14:51:01
int
HBase在金融大数据迁移中的应用与挑战

随着最后一台设备的下线，标志着超过10PB的HBase数据迁移项目顺利完成。目前，新的集群已在新机房稳定运行超过两个月，监控数据显示，新集群的查询响应时间显著降低，系统稳定性大幅提升。此外，数据消费的波动也变得更加平滑，整体性能得到了显著优化。 ... [详细]

蜡笔小新 2024-10-31 14:06:06
int
2019年后蚂蚁集团与拼多多面试经验详述与深度剖析

2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]

蜡笔小新 2024-10-30 17:30:06
int
深入解析Java中HashCode的功能与应用

本文深入探讨了Java中HashCode的功能与应用。在Java中，HashCode主要用于提高哈希表（如HashMap、HashSet）的性能，通过快速定位对象存储位置，减少碰撞概率。文章详细解析了HashCode的生成机制及其在集合框架中的作用，帮助开发者更好地理解和优化代码。此外，还介绍了如何自定义HashCode方法以满足特定需求，并讨论了常见的实现误区和最佳实践。 ... [详细]

蜡笔小新 2024-10-30 17:19:50
int
深入解析零拷贝技术（Zerocopy）及其应用优势

零拷贝技术（Zero-copy）是Netty框架中的一个关键特性，其核心在于减少数据在操作系统内核与用户空间之间的传输次数。通过避免不必要的内存复制操作，零拷贝显著提高了数据传输的效率和性能。本文将深入探讨零拷贝的工作原理及其在实际应用中的优势，包括降低CPU负载、减少内存带宽消耗以及提高系统吞吐量等方面。 ... [详细]

蜡笔小新 2024-10-30 12:14:45
int
深入理解Spark框架：RDD核心概念与操作详解

RDD是Spark框架的核心计算模型，全称为弹性分布式数据集（Resilient Distributed Dataset）。本文详细解析了RDD的基本概念、特性及其在Spark中的关键操作，包括创建、转换和行动操作等，帮助读者深入理解Spark的工作原理和优化策略。通过具体示例和代码片段，进一步阐述了如何高效利用RDD进行大数据处理。 ... [详细]

蜡笔小新 2024-10-29 20:10:01
int
深入解析十大经典排序算法：动画演示、原理分析与代码实现

本文深入探讨了十种经典的排序算法，不仅通过动画直观展示了每种算法的运行过程，还详细解析了其背后的原理与机制，并提供了相应的代码实现，帮助读者全面理解和掌握这些算法的核心要点。 ... [详细]

蜡笔小新 2024-10-29 12:31:50
int
深入解析Spring框架中的双亲委派机制突破方法

在探讨Spring框架中突破双亲委派机制的方法之前，首先需要了解类加载器的基本概念。类加载器负责将类的全限定名转换为对应的二进制字节流。每个类在被特定的类加载器加载后，其唯一性得到保证。然而，这种机制在某些场景下可能会限制灵活性，因此Spring框架提供了一些策略来突破这一限制，以实现更加动态和灵活的类加载。这些策略不仅能够提升系统的可扩展性，还能在复杂的运行环境中确保类的正确加载和管理。 ... [详细]

蜡笔小新 2024-10-28 14:52:32
int
全面解读 Java 枚举类型的应用与实践

本文深入探讨了Java枚举类型的使用与实践，详细解析了枚举的基本用法及其在实际开发中的应用。首先介绍了枚举作为常量的替代方案，自JDK 1.5起，通过枚举可以更加简洁、安全地定义常量，避免了传统方式中可能出现的错误。此外，文章还探讨了枚举在实现单例模式、状态机等场景中的优势，并提供了多个实际案例，帮助开发者更好地理解和运用这一强大的语言特性。 ... [详细]

蜡笔小新 2024-10-28 09:38:24
select
阿里巴巴Java后端开发面试：TCP、Netty、HashMap、并发锁与红黑树深度解析

阿里巴巴Java后端开发面试：TCP、Netty、HashMap、并发锁与红黑树深度解析 ... [详细]

蜡笔小新 2024-10-26 14:26:06
select
通过一张截图深入解析字节跳动的 Java 开发实力

在与一位来自字节跳动的朋友交流时了解到，根据他们近期招聘Java工程师的经验，大多数候选人往往在工作3年后会遇到一个难以跨越的瓶颈期。这是因为在职业生涯的这个阶段，许多工程师的技术深度和广度已经达到了一定的水平，但要进一步提升则需要更多的挑战和学习机会。字节跳动作为一家技术驱动的公司，通过严格的面试流程和实际项目经验，能够更好地评估候选人的技术水平和发展潜力。 ... [详细]

蜡笔小新 2024-10-25 17:38:05

docetaxel

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章