Dalivik垃圾回收收机制CocurrentGC简介

作者：w3a00048_304 | 来源：互联网 | 2023-09-03 19:55

在C/C++中，开发者需要手动地管理在堆中分配的内存，但是这往往导致很多问题。

1、内存分配之后忘记释放，造成内存泄漏。

2、非法访问那些已经释放了的内存，引发程序崩溃。

没有一个好的C/C++应用程序开发框架，一般的开发者根本无法驾驭内存问题，因为程序大了之后，很容易造成失控。最要命的是，内存被破坏的时候，并不一定就是程序崩溃的时候，它就是一颗不定时炸弹，说不准什么时候会被引爆，查找原因也是非常困难的。Java 语言运行在虚拟机上，虚拟机可以自动回收那些不再使用了的Java Object，也就是那些不再被引用了的Java Object。这就是Java语言的一种重要特性--垃圾自动收集机制。垃圾回收机制将开发者从内存问题中解放出来，极大地提高了开发效率，以及提高了程序的可维护性。这也是Android为什么会选择Java而不是C/C++来作为主要应用程序开发语言的原因之一。就是为了能够让开发远离内存问题，而将精力集中在业务上，开发出更多更好的APP来，从而迎头赶超iOS。Android系统内存也存在大量的C/C++代码，这只要考虑性能问题，不过，为了避免出现内存问题，在Android系统内部的C++代码，大量地使用了智能指针来自动管理对象的生命周期。选择Java来作为Android应用程序的开发语言，可以说是技术与商业之间一个折衷，事实证明，这种折衷是成功的。

Android 垃圾回收机制简史：

在GingerBread（android2.3）之前，Dalvik虚拟使用的垃圾收集机制有以下特点：

1. Stop-the-world，也就是垃圾收集线程在执行的时候，其它的线程都停止；

2. Full heap collection，也就是一次收集完全部的垃圾；

3. 一次垃圾收集造成的程序中止时间通常都大于100ms。

GingerBread（android2.3）---Kit Kat（4.4），Dalvik虚拟使用的垃圾收集机制得到了改进

1. Cocurrent GC : 也就是大多数情况下，垃圾收集线程与其它线程是并发执行的

2. Partial collection，也就是一次可能只收集一部分垃圾；

3. 一次垃圾收集造成的程序中止时间通常都小于5ms。

Kit Kat（4.4以上版本），Android开始使用ART替代Dalivk虚拟机, ART的垃圾回收机制有一次做了优化

特点和Dalivik基本一致，效率上比Dalivik更优！！！

Dalivk的堆管理

图1 Dalvik虚拟机垃圾收集机制的基本概念

1、Dalivik堆:

所有的java对象都是在Dalivik堆上面申请的， Dalivik堆分为两部分。Active Heap 和 Zygote Heap。事实上，Dalvik虚拟机的堆最初是只有一个的，也就是Zygote进程在启动过程中创建Dalvik虚拟机的时候，只有一个堆。但是当Zygote进程在fork第一个应用程序进程之前，会将已经使用了的那部分堆内存划分为一部分，还没有使用的堆内存划分为另外一部分。前者就称为Zygote堆，后者就称为Active堆

2、Heap Bitmap:

堆位图，用于记录android中所有应用程序的Java 对象的引用情况。两个Bitmap来描述堆的对象的状态。一个称为Live Bitmap，另一个称为Mark Bitmap。Heap Bitmap使用位图来标记对象是否被使用。如果一个对象被引用，那么在Bitmap中与它对应的那一位就会被设置为1。否则的话，就设置为0。Live Bitmap用来标记上一次GC时被引用的对象，也就是没有被回收的对象，而Mark Bitmap用来标记当前GC有被引用的对象。有了这两个信息之后，我们就可以很容易地知道哪些对象是需要被回收的，即在Live Bitmap在标记为1，但是在Mark Bitmap中标记为0的对象。

3、Card Table:

在垃圾收集的Mark阶段，要求除了垃圾收集线程之外，其它的线程都停止，否则的话，就会可能导致不能正确地标记每一个对象。这种现象在垃圾收集算法中称为Stop The World，会导致程序中止执行，造成停顿的现象。为了尽可能地减少停顿，我们必须要允许在Mark阶段有条件地允许程序的其它线程执行。这种垃圾收集算法称为并行垃圾收集算法Concurrent GC。为了实现Concurrent GC，Mark阶段又划分两个子阶段。

4、Mark Stack:

在Mark阶段，Dalvik虚拟机能过递归方式来标记对象。但是，这不是通过函数的递归调用来实现的，而是借助一个称为Mark Stack的栈来实现的。

1. 为什么要把用来分配对象的堆划分为Active堆和Zygote堆 ?

Android系统的第一个Dalvik虚拟机是由Zygote进程创建的。应用程序进程是由Zygote进程fork出来的。也就是说，应用程序进程使用了一种写时拷贝技术（COW）来复制了Zygote进程的地址空间。这意味着一开始的时候，应用程序进程和Zygote进程共享了同一个用来分配对象的堆。然而，当Zygote进程或者应用程序进程对该堆进行写操作时，内核就会执行真正的拷贝操作，使得Zygote进程和应用程序进程分别拥有自己的一份拷贝。拷贝是一件费时费力的事情。因此，为了尽量地避免拷贝，Dalvik虚拟机将自己的堆划分为两部分。事实上，Dalvik虚拟机的堆最初是只有一个的。也就是Zygote进程在启动过程中创建Dalvik虚拟机的时候，只有一个堆。但是当Zygote进程在fork第一个应用程序进程之前，会将已经使用了的那部分堆内存划分为一部分，还没有使用的堆内存划分为另外一部分。前者就称为Zygote堆，后者就称为Active堆。以后无论是Zygote进程，还是应用程序进程，当它们需要分配对象的时候，都在Active堆上进行。这样就可以使得Zygote堆尽可能少地被执行写操作，因而就可以减少执行写时拷贝的操作。

在Zygote堆里面分配的对象其实主要就是Zygote进程在启动过程中预加载的类、资源和对象了。这意味着这些预加载的类、资源和对象可以在Zygote进程和应用程序进程中做到长期共享。这样既能减少拷贝操作，还能减少对内存的需求。

2. 堆/堆管理

图2 Dalvik虚拟机的堆

在Dalvik虚拟机中，堆实际上就是一块匿名共享内存。Dalvik虚拟机并不是直接管理这块匿名共享内存，而是将它封装成一个mspace，交给C库来管理。mspace是libc中的概念，我们可以通过libc提供的函数create_mspace_with_base创建一个mspace，然后再通过mspace_开头的函数管理该mspace。例如，我们可以通过mspace_malloc和mspace_bulk_free来在指定的mspace中分配和释放内存。实际上，我们在使用libc提供的函数malloc和free分配和释放内存时，也是在一个mspace进行的，只不过这个mspace是由libc默认创建的。Dalvik虚拟机除了要给应用层分配对象之外，最重要的还是要对这些已经分配出去的对象进行管理，也就是要在对象不再被使用的时候，对其进行自动回收。

GC回收原理

Dalvik虚拟机执行完成一次垃圾收集之后，我们通常可以看到类似以下的日志输出：

D/dalvikvm(9050): GC_CONCURRENT freed 2049K, 65% free 3571K/9991K, external 4703K/5261K, paused 2ms+2ms copy

在这一行日志中，

1、 GC_CONCURRENT表示GC原因

2、 2049K表示总共回收的内存

3、 3571K/9991K表示Java Object Heap统计，即在9991K的Java Object Heap中，有3571K是正在使用的

4、 4703K/5261K表示External Memory统计，即在5261K的External Memory中，有4703K是正在使用的

5、 2ms+2ms表示垃圾收集造成的程序中止时间。

Dalivk垃圾收集的使用的耳熟能详，大名鼎鼎的的Mark-Sweep算法。 Mark-Sweep垃圾收集算法主要分为两个阶段：Mark和Sweep。

1.Mark阶段从对象的根集开始标记被引用的对象。标记完成后，就进入到Sweep阶段

2.Sweep阶段所做的事情就是回收没有被标记的对象占用的内存。

下面我们来介绍一下在Mark和Sweep 过程中堆管理的结构体的作用

1.Bitmap:

这里涉及到的一个核心概念就是我们怎么标记对象有没有被引用的，换句说就是通过什么数据结构来描述对象有没有被引用。是的，就是图1中的Heap Bitmap了。Heap Bitmap的结构如图3所示：
Dalivik垃圾回收收机制Cocurrent GC简介

图3 Heap Bitmap

1、在Dalvik虚拟机中，使用一个unsigned long数组来描述一个Heap Bitmap。

2、我们使用libc提供的函数mspace_malloc来从堆里面分配内存时，得到的内存的地址总是对齐到HB_OBJECT_ALIGNMENT（8）的，也就是说，我们分配的对象的地址的最低三位总是0。为了减少Bitmap的大小。 Bitmap中的位与对象的对应关系时，忽略最低三位。

2.Card Table:

为了实现Concurrent GC，Mark阶段又划分两个子阶段。

1、第一阶段：只负责标记根集对象。所谓的根集对象，就是指在GC开始的瞬间，被全局变量、栈变量和寄存器等引用的对象。

2、第二阶段：负责标记被根集对象引用的对象的过程就是。有了这些根集变量之后，我们就可以顺着它们找到其余的被引用变量。例如，一个栈变量引了一个对象，而这个对象又通过成员变量引用了另外一个对象，那该被引用的对象也会同时标记为正在使用。

在Concurrent GC，第一个子阶段是不允许垃圾收集线程之外的线程运行的，但是第二个子阶段是允许的。不过，在第二个子阶段执行的过程中，如果一个线程修改了一个对象，那么该对象必须要记录起来，因为它很有可能引用了新的对象，或者引用了之前未引用过的对象。如果不这样做的话，那么就会导致被引用对象还在使用然而却被回收。这种情况出现在只进行部分垃圾收集的情况，这时候Card Table的作用就是用来记录非垃圾收集堆对象对垃圾收集堆对象的引用。

Dalvik虚拟机进行部分垃圾收集时，实际上就是只收集在Active堆上分配的对象。因此对Dalvik虚拟机来说，Card Table就是用来记录在Zygote堆上分配的对象在部收垃圾收集执行过程中对在Active堆上分配的对象的引用。

我们是不是想到再用一个Bitmap在描述上述第二个子阶段被修改的对象呢？虽然我们尽大努力减少了用来标记对象的Bitmap的大小，不过还是比较可观的。

因此，为了减少内存的消耗，我们使用另外一种技术来标记Mark第二子阶段被修改的对象。这种技术使用到了一种称为Card Table的数据结构，如图4所示：

图4 Card Table

从名字可以看出，Card Table由Card组成，一个Card实际上就是一个字节，它的值要么是CLEAN，要么是DIRTY。

如果一个Card的值是CLEAN，就表示与它对应的对象在Mark第二子阶段没有被程序修改过。否则的话，就意味着被程序修改过，对于这些被修改过的对象。需要在Mark第二子阶段结束之后，再次禁止垃圾收集线程之外的其它线程执行，以便垃圾收集线程再次根据Card Table记录的信息对被修改过的对象引用的其它对象进行重新标记。

由于Mark第二子阶段执行的时间不会太长，因此在该阶段被修改的对象不会很多，这样就可以保证第二次子阶段结束后，再次执行标记对象的过程是很快的，因而此时对程序造成的停顿非常小。

在Card Table中，在连续GC_CARD_SIZE地址中的对象共用一个Card。Dalvik虚拟机将GC_CARD_SIZE的值设置为128。因此，假设堆的大小为Max Heap Size，那么我们只需要一块字节数为（Max Heap Size / 128）的Card Table。相比大小为（Max Heap Size / 8 / 32）× 4的Bitmap，减少了一半的内存需求。

2.Mark Stack:

在Mark阶段，Dalvik虚拟机能过递归方式来标记对象。但是，这不是通过函数的递归调用来实现的，而是借助一个称为Mark Stack的栈来实现的。

具体来说，当我们标记完成根集对象之后，就按照它们的地址从小到大的顺序标记它们所引用的其它对象。

假设有A、B、C和D四个对象，它的地址大小关系为A 更好的做法是将对象A记录在一个Mark Stack中，然后继续检查地址值比对象D大的其它对象。对于地址值比对象D大的其它对象，如果它们引用了一个地址值比它们小的其它对象，那么这些其它对象同样要记录在Mark Stack中。等到该轮检查结束之后，再回过头来检查记录在Mark Stack里面的对象。然后又重复上述过程，直到Mark Stack等于空为止。

这就是我们在图1中显示的Mark Stack的作用，它的具体结构如图5所示：

图5 Mark Stack

在Dalvik虚拟机中，每一个对象都是从Object类继承下来的，也就是说，每一个对象占用的内存大小都至少等于sizeof(Object)。此外，我们通过libc提供的函数mspace_malloc为对象分配内存时，libc需要额外的内存来记录被分配出去的内存的信息。例如，需要记录被分配出去的内存的大小。每一块分配出去的内存需要额外的HEAP_SOURCE_CHUNK_OVERHEAD内存来记录上述的管理信息。因此，在Dalvik虚拟机中，每一个对象的大小都至少为sizeof(Object) + HEAP_SOURCE_CHUNK_OVERHEAD。这就意味着对于一个大小为Max Heap Size的堆来说，最多可以分配Max Heap Size / (sizeof(Object) + HEAP_SOURCE_CHUNK_OVERHEAD)个对象。于是，在最坏情况下，我们就需要一个大小为（Max Heap Size / (sizeof(Object) + HEAP_SOURCE_CHUNK_OVERHEAD)）的Object*数组来描述Mark Stack，以便可以实现上述的非递归函数调用的递归标记算法。

编程

php

java

android

io

go

bit

日志

算法

写下你的评论吧 !

吐个槽吧,看都看了

会员登录 | 用户注册

推荐阅读

js
LDAP服务器配置与管理

本文介绍如何通过安装和配置SSSD服务来统一管理用户账户信息，并实现其他系统的登录调用。通过图形化交互界面配置LDAP服务器，确保用户账户信息的集中管理和安全访问。 ... [详细]

蜡笔小新   2024-11-13 18:19:52

post
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新   2024-11-13 09:49:14

post
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新   2024-11-12 13:59:27

js
系统数据实体验证异常：多个实体验证失败的错误处理与分析

在使用MVC和EF框架进行数据保存时，遇到了 `System.Data.Entity.Validation.DbEntityValidationException` 错误，表明存在一个或多个实体验证失败的情况。本文详细分析了该错误的成因，并提出了有效的处理方法，包括检查实体属性的约束条件、调试日志的使用以及优化数据验证逻辑，以确保数据的一致性和完整性。 ... [详细]

蜡笔小新   2024-11-11 16:54:45

js
MySQL查询执行流程详解

MySQL的查询执行流程涉及多个关键组件，包括连接器、查询缓存、分析器和优化器。在服务层，连接器负责建立与客户端的连接，查询缓存用于存储和检索常用查询结果，以提高性能。分析器则解析SQL语句，生成语法树，而优化器负责选择最优的查询执行计划。这一流程确保了MySQL能够高效地处理各种复杂的查询请求。 ... [详细]

蜡笔小新   2024-11-11 16:48:32

object
Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨

在《Cocos2d-x学习笔记：基础概念解析与内存管理机制深入探讨》中，详细介绍了Cocos2d-x的基础概念，并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解，例如在处理鱼的运动过程中，可以通过编写自定义函数来动态计算角度变化，利用CallFunc回调机制实现高效的游戏逻辑控制。此外，文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏，为开发者提供了实用的编程技巧和最佳实践。 ... [详细]

蜡笔小新   2024-11-11 14:49:31

utf-8
如何将TS文件转换为M3U8直播流：HLS与M3U8格式详解

在视频传输领域，MP4虽然常见，但在直播场景中直接使用MP4格式存在诸多问题。例如，MP4文件的头部信息（如ftyp、moov）较大，导致初始加载时间较长，影响用户体验。相比之下，HLS（HTTP Live Streaming）协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段，并生成一个M3U8播放列表文件，实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流，包括技术原理和具体操作步骤，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新   2024-11-11 12:12:04

get
FFMpeg学习进阶：音频处理基础理论与重采样技术详解

在Android平台中，播放音频的采样率通常固定为44.1kHz，而录音的采样率则固定为8kHz。为了确保音频设备的正常工作，底层驱动必须预先设定这些固定的采样率。当上层应用提供的采样率与这些预设值不匹配时，需要通过重采样（resample）技术来调整采样率，以保证音频数据的正确处理和传输。本文将详细探讨FFMpeg在音频处理中的基础理论及重采样技术的应用。 ... [详细]

蜡笔小新   2024-11-09 13:46:55

object
Insufficient Memory Allocation: Unable to Reserve 1572864KB for Object Heap

该问题可能由守护进程配置不当引起，例如未识别的JVM选项或内存分配不足。建议检查并调整JVM参数，确保为对象堆预留足够的内存空间（至少1572864KB）。此外，还可以优化应用程序的内存使用，减少不必要的内存消耗。 ... [详细]

蜡笔小新   2024-11-08 20:06:16

post
Java能否直接通过HTTP将字节流绕过HEAP写入SD卡？

Java能否直接通过HTTP将字节流绕过HEAP写入SD卡？ ... [详细]

蜡笔小新   2024-11-08 09:14:47

object
基址获取与驱动开发：内核中提取ntoskrnl模块的基地址方法解析

基址获取与驱动开发：内核中提取ntoskrnl模块的基地址方法解析 ... [详细]

蜡笔小新   2024-11-04 15:56:02

js
自定义滚动条美化页面内容

当页面内容超出显示范围时，为了提升用户体验和页面美观，通常会添加滚动条。如果默认的浏览器滚动条无法满足设计需求，我们可以自定义一个符合要求的滚动条。本文将详细介绍自定义滚动条的实现过程。 ... [详细]

蜡笔小新   2024-11-12 17:12:24

get
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新   2024-11-12 16:19:40

post
在CentOS 7环境中安装配置Redis及使用Redis Desktop Manager连接时的注意事项与技巧

在 CentOS 7 环境中安装和配置 Redis 时，需要注意一些关键步骤和最佳实践。本文详细介绍了从安装 Redis 到配置其基本参数的全过程，并提供了使用 Redis Desktop Manager 连接 Redis 服务器的技巧和注意事项。此外，还探讨了如何优化性能和确保数据安全，帮助用户在生产环境中高效地管理和使用 Redis。 ... [详细]

蜡笔小新   2024-11-11 18:27:44

object
C#编程指南：利用ASP.NET和JavaScript实现带有Fingerprint功能的Web应用登录系统

本指南介绍了如何在ASP.NET Web应用程序中利用C#和JavaScript实现基于指纹识别的登录系统。通过集成指纹识别技术，用户无需输入传统的登录ID即可完成身份验证，从而提升用户体验和安全性。我们将详细探讨如何配置和部署这一功能，确保系统的稳定性和可靠性。 ... [详细]

蜡笔小新   2024-11-09 18:14:37

w3a00048_304

这个家伙很懒，什么也没留下！

Tags | 热门标签

hashtable

byte

integer

scala

golang

php

get

split

jar

js

python3

usb

function

object

filter

express

frameworks

httprequest

cpython

hashset

random

post

foreach

utf-8

iostream

perl

typescript

cSharp

substring

schema

RankList | 热门文章

10/1背包问题（动态规划+动规优化）

2matlab温度数据怎么滤波_Kalman滤波初学者入门

3火狐为 Firefox所有用户推出了GPC

4activeMQ高级特性之异步投递与确认签收回调

5python2.7读取csv_读取CSV文件，操作列并将结果追加到新列中。Python 2.7

6如何在Win7系统下设置双屏显示？

7Android 公交线路 VerticalStepView

8请你谈谈cookie的弊端

9深灰色|表里_Unity3D入门教程Unity3D简介安装和程序发布

10对症下药后，我半年就上了岸

11在c＃中创建时间戳的函数 - Function that creates a timestamp in c#

12忽略大小写并在C＃中进行比较[重复] - Ignore case and compare in C# [duplicate]

13C# WinForm 中在窗口标题栏上加按钮(转)

14鸿蒙os正式发布,华为鸿蒙OS系统正式发布：微内核全场景，面向全球开源！

15[Design] Interpreter Pattern