作者:xlenny | 来源:互联网 | 2023-10-13 18:13
引用计数算法有着诸多的优点,但它的缺点也是很明显的。整个过程分为两个阶段:标记阶段找到所有存活对象;清除阶段清除所有垃圾对象。它的整个过程可以描述为:标记所有的存活对象;通过重新调
1.引用计数算法
“参照计数”(Reference Counting )算法计算每个对象指向它的指针数,并在一个指针指向自己时将计数值加1。 删除指向自己的指针后,计数值将减少1。 如果计数值减少到0,则指向该对象的指针将不再存在,因此可以安全地丢弃。 可以直观地用下图表示。
引用计数算法的优点是内存管理开销在APP应用程序运行时分散,非常“平滑”,不需要因为垃圾回收而停止APP应用程序的运行。 另一个优点是空间参考的局部性很高。 当一个对象的引用计数值变为0时,系统不需要访问堆中其他页面上的设备。 此外,后面介绍的一些垃圾回收算法在回收之前遍历所有生存单元。 这可能会引起页面转换操作。 最后的引用计数算法提供了类似堆栈分配的方式,丢弃就回收。 接下来看到的一些垃圾回收算法是对象废弃后生存一段时间再回收。
引用计数算法有很多优点,但其缺点也很明显。 首先,您可以看到的是时间开销,每次创建或释放对象时都会计算引用计数值,从而产生额外的开销。 第二种空间开销,每个对象必须留出额外的空间来存储参考计数值,以保持自己参考的数目; 引用计数算法的最大缺点是无法处理环引用,如下图所示。
这里蓝色的两个对象既不能到达也不能回收。 因为它们互相参照,各自的计数值不是0。 这对引用计数算法来说是无能为力的,但其他垃圾回收算法能很好地处理环引用。
引用算法最有名的运用莫过于微软的COM技术,著名的IUnknown接口:
interfaceiunknown { virtual hresult _ stdcallqueryinterface,void**PPV}=0; virtualulong_stdcalladdref(=0; virtualulong_stdcallrelease(=0; }
这里的AddRef和Release是为了让组件本身能够管理生命周期,客户端程序只关心接口,而不需要关心组件的生命周期。 以下是一个简单的使用案例。
int main () { IUnknown* pi=CreateInstance ); IX* pix=NULL; hresult HR=pi-query接口(iid _ IX,) void * (pix ); if (安全(HR ) ) { pix-DoSomething; pix-Release (; (} pi-Release ); }上的客户端程序已经在CreateInstance中调用了AddRef,因此不需要再次调用,而是在使用接口后调用Release。 这将改变组件自身维护的计数值。 以下代码显示了一个简单的实现AddRef和Release的示例。
ULONG _stdcall AddRef () { return m_cRef; }ULONG _stdcall Release () if(-m_cref==0) { delete this; 返回0; } return m_cRef; }
在编程语言Python中,使用也是一种引用计数算法,如果对象的引用计数值为0,则调用__del__函数。 至于为什么Python选择引用计数算法,我读的文章说,因为Python是脚本语言,所以经常与C/C等语言进行交互,通过使用引用计数算法避免对象在内存中的更改因为Python还引入了gc模块来解决环引用问题,所以本质上python GC的方案是混合引用计数和跟踪(后面介绍的三种算法)两种垃圾回收机制。
2.标记-清除算法
“标记-清除”(朴素的黑猫-Sweep )算法依赖于确定可以通过一次全局遍历回收所有存活对象的对象。 遍历过程从根中找到所有可到达的对象,其他不可到达的对象是垃圾对象,可以回收。 整个过程分为两个阶段。 标记阶段会找到所有的生存对象。 逐步清除所有垃圾对象。
标记阶段
清除舞台
lign="left">
相比较引用计数算法,标记-清除算法可以非常自然的处理环形引用问题,另外在创建对象和销毁对象时时少了操作引用计数值的开销。它的缺点在于标记-清除算法是一种“停止-启动”算法,在垃圾回收器运行过程中,应用程序必须暂时停止,所以对于标记-清除算法的研究如何减少它的停顿时间,而分代式垃圾收集器就是为了减少它的停顿时间,后面会说到。另外,标记-清除算法在标记阶段需要遍历所有的存活对象,会造成一定的开销,在清除阶段,清除垃圾对象后会造成大量的内存碎片。
3.标记-缩并算法
标记-缩并算法是为了解决内存碎片问题而产生的一种算法。它的整个过程可以描述为:标记所有的存活对象;通过重新调整存活对象位置来缩并对象图;更新指向被移动了位置的对象的指针。
标记阶段:
清除阶段:
标记-压缩算法最大的难点在于如何选择所使用的压缩算法,如果压缩算法选择不好,将会导致极大的程序性能问题,如导致Cache命中率低等。一般来说,根据压缩后对象的位置不同,压缩算法可以分为以下三种:
1. 任意:移动对象时不考虑它们原来的次序,也不考虑它们之间是否有互相引用的关系。
2. 线性:尽可能的将原来的对象和它所指向的对象放在相邻位置上,这样可以达到更好的空间局部性。
3. 滑动:将对象“滑动”到堆的一端,把存活对象之间的自由单元“挤出去”,从而维持了分配时的原始次序。
4.节点拷贝算法
节点拷贝算法是把整个堆分成两个半区(From,To), GC的过程其实就是把存活对象从一个半区From拷贝到另外一个半区To的过程,而在下一次回收时,两个半区再互换角色。在移动结束后,再更新对象的指针引用,GC开始前的情形:
GC结束后的情形:
节点拷贝算法由于在拷贝过程中,就可以进行内存整理,所以不会再有内存碎片的问题,同时也不需要再专门做一次内存压缩。,而它最大的缺点在于需要双倍的空间。
5.总结
本文总共介绍了四种经典的垃圾回收算法,其中后三种经常称之为跟踪垃圾回收,因为引用计数算法能够平滑的进行垃圾回收,而不会出现“停止”现象,经常出现于一些实时系统中,但它无法解决环形问题;而基于跟踪的垃圾回收机制,在每一次垃圾回收过程中,要遍历或者复制所有的存活对象,这是一个非常耗时的工作,一种好的解决方案就是对堆上的对象进行分区,对不同区域的对象使用不同的垃圾回收算法,分代式垃圾回收器正是其中一种,CLR和JVM中都采用了分代式垃圾回收机制,但它们在处理上又有些不同,后面的文章再详细介绍这两种垃圾回收器的区别。
更加详细请参见于:http://www.cnblogs.com/Terrylee/
更多内容:http://blog.csdn.net/wallwind