从本文开始,将持续更新GC算法,GC算法是面试java必问的知识,同时,在c,c++这种需要手动GC的语言,更是需要掌握的算法,一起加油吧!
本篇是接下来算法的前置知识,毕竟搞懂算法逻辑的基础,是搞懂概念
结构
对象
组成:
- 头:保存对象的一些基本信息,比如大小,种类等,他的地址也代表对象的地址,类似于数组的首地址
- 域:对象中可以访问的部分,里面可以有各种数据,也可以有指向其他对象的指针(指向其他对象的头)
分类
- 活动对象:能被mutator引用的对象(后面会讲),可以理解为能被引用的对象
- 非活动对象:不能被mutator引用的对象,这种对象就是将被GC的对象,称为垃圾
mutator
这是一种动作,作用是改变GC中对象的引用关系,可以类比为new操作,new就是新建一个对象,mutator可以申请内存,为new对象做准备,也可以修改对象的域中指针的方向
其他结构
- 堆:执行程序时存放对象的空间
- 根:指向对象的指针的起点
- 分块:当mutator时,从堆中分出去的一块内存
- 分配:从堆中选出一个分块给mutator的方法
算法评价
如何判定一个GC算法是好的呢?有以下几个方面
-
吞吐量throughput:单位时间内的处理能力
计算方法是:heap_size/GC的时间
比如
上图中的throughput=堆的大小/(A+B+C),A,B,C为三次GC -
最大暂停时间:因GC而暂停mutator的最大时间
从上图看出,当GC触发时,mutator将会暂停,所以也可以理解为单次GC所需要的最大时间,图中B最长,所以最大暂停时间是B -
堆使用效率
有两方面,
一是对象的头,对象中,头越大,信息越多,越方便找到他,但是效率会降低,因为头大了,对象大小不变的话,所能生成的对象数量就会减少二是利用率,如果算法越好,对堆的利用率越高当然好,但是相应的GC会越困难,类比hash算法虽然可以通过映射使得数组空间得以最大利用,但是因此数组排列很不规律。在堆中也是一样,类似的对象或许分布堆中各地,很难去全部找出
-
访问局部性
某些对象由于有较强相关性,会一起生成,一起毁灭,比如有boyfriend就会有girlfriend,这类对象最好放在相近的地方,好生成,好清除
所以,我们的GC算法追求的是较大的吞吐量,较小的最大暂停时间,合适的利用率,以及最大限度的局部性
现在你已经掌握的学习GC的所有前置知识啦,一起来学习GC算法吧