垃圾回收需要思考三件事情,哪些内存需要回收?什么时候回收?如何回收?
JVM 的内存区域
中,
程序计数器、虚拟机栈和本地方法栈
的生命周期是随线程而生,随线程而灭的。这几个区域的
内存分配和回收都具有确定性
,
不需要过多考虑回收问题
,当方法或线程结束时,内存自然就跟着回收了。
Java 堆和方法区
是具有不确定性的,比如一个方法根据不同的条件执行可能需要的内存是不同的。只有处于运行期才能知道需要创建哪些对象,创建多少对象,
这部分的内存分配和回收是动态的,垃圾回收所关注的就是这部分内存
。
Java 堆中存放了几乎所有的对象实例,垃圾回收器在进行回收前,需要判断哪些对象“存活”,哪些对象“死亡”,“死亡”的对象才会被回收。
给对象中添加一个
引用计数器
:
这个方法实现简单,效率高,但是
目前主流的虚拟机中并没有选择这个算法来管理内存
,其最主要的原因是它很难解决对象之间相互循环引用的问题。
通过一系列被称为
GC Roots
的根对象作为起始节点集,从这些节点开始,通过引用关系向下搜寻,搜寻走过的路径称为“引用链”,如果某个对象到
GC Roots
没有任何“引用链”相连,就说明该对象不可达,即可以被回收。
如下图,Object 5、Object 6、Object 7 虽有关联,但是到
GC Roots
是不可达的,因此会被判定“死亡”。
Java 中固定可作为
GC Root
对象的有:
除了这些固定的还有一些临时性加入的,有兴趣的可以看下《深入理解 Java 虚拟机》。
上述两种方法都需要了解引用,详细介绍见
Java引用
。
不要求虚拟机在方法区进行垃圾回收,在 Java 堆中,尤其是在新生代中,常规进行一次垃圾收集通常可以回收70%至99%的内存空间,相比之下,在方法区进行回收的“性价比”较低。该区域的垃圾回收主要是两个部分,
废弃的常量和不再使用的类
。
假如在字符串常量池中曾存在字符串 “java”,如果当前没有任何字符串对象引用该字符串常量的话,就说明常量 “java” 就是废弃常量,如果这时发生内存回收的话而且有必要的话,”java” 就会被系统清理出常量池了。
类需要同时满足下面 3 个条件才能算是 “不在被使用的类” :
这里整理的均为“追踪式垃圾回收“,也成为”间接垃圾回收“。
Java 堆
的区域划分如下图,被分为新生代、老年代、永久代或元空间,具体划分为五大块区域,不同的 GC 会针对不同的区域进行垃圾回收。
GC类型一般有以下几大类:
分类 | 说明 |
---|---|
Minor GC | 也称“Young GC”,只针对新生代进行的垃圾回收。 |
Major GC | 也称“Old GC”,只针对老年代进行的垃圾回收 |
Mixed GC | 针对新生代和部分老年代进行垃圾回收,部分垃圾收集器才支持。 |
Full GC | 针对整个Java堆和方法区进行的垃圾回收,耗时最久的GC |
最早出现的垃圾回收算法,分为“标记”、“清除”两个阶段。可以标记存活的对象,也可以标记要回收的对象。
该算法有两个缺点:
标记-清除算法执行过程如下图:
简称复制算法,为了解决标记-清除算法面对大量可回收对象执行效率低的问题,就是
将内存分成两个区域,每次只使用其中一个区域,当该区域内存满了之后,会将还存活的对象复制到另一个区域,然后将原区域直接清理掉
。
该算法有两个缺点:
标记-复制算法执行过程如下图:
由于 Java 的新生代对象存活率不高,所以一般针对新生代的垃圾回收使用标记-复制算法
。
如下图,将新生代分为内存较大的
Eden
,和两块内存较小的
Survivor
。每次分配内存只使用
Eden
和其中一个
Survivor
,我们假设第一次分配内存是
Eden
、
Survivor 0
。
Eden
Survivor 0
Survivor 1
Eden
Survivor 0
Eden
Survivor 1
注意:
当
Survivor
不足以容纳轻 GC 之后的对象时,就需要依赖老年代来进行内存分配了
。
标记完存活对象以后,让所有存活对象都向内存空间的一端移动,然后在清理掉边界以外的内存。
标记-整理算法执行过程如下图:
这种涉及到了对象的移动,如果移动存活对象,尤其是老年代这种每次回收都有大量对象存活的区域,会耗时很多,并且对象移动操作会全部暂停用户应用程序才能进行,这样会产生停顿时间。
这种停顿被称为
Stop The World
。
先使用标记-清除算法进行垃圾回收,暂时容忍内存碎片的存在,直到碎片过多影响对象分配时,在进行标记-整理算法进行回收,获得规整空间。
下图展示了 7 种经典垃圾收集器,
若两两出现互连情况,则表明两者它们可以搭配使用
。
最基本、历史最早的垃圾收集器了。单线程的收集器,收集垃圾时,必须暂停其他所有工作线程,也就是必有停顿,使用
复制算法
。
多线程并行版本的 Serial 收集器,收集垃圾时,必须暂停其他所有工作线程,也就是必有停顿,使用
复制算法
。
类似 Par New 收集器,但关注点是达到一个可控的吞叶量,使用
复制算法
。
吞吐量公式:
吞吐量示例:
代码运行 95 秒 , 垃圾收集器运行 5 秒 , 那么吞吐量就是 $\frac{95}{95 + 5} = 0.95$
Serial 收集器的老年代版本,单线程收集器,使用
标记-整理算法
。它主要有两大用途:
Parallel Scavenge收集器的老年代版本。使用多线程和
标记-整理算法
。在注重吞吐量以及CPU资源的场合,都可以优先考虑 Parallel Scavenge收集器和Parallel Old收集器(JDK8默认的新生代和老年代收集器)。
是一种以获取最短回收停顿时间为目标的收集器。它非常符合在注重用户体验的应用上使用,它是HotSpot虚拟机第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程(基本上)同时工作。
整个过程分为5个步骤:初始标记→并发标记→重新标记→并发清理→并发重置。
基于标记整理算法实现,运作流程主要包括以下:初始标→并发标记→最终标记→筛选回收,不会产生空间碎片,可以精确地控制停顿,可以支持用户设置期望停顿时间。
不追求一次性将 Java 堆清理干净,只要垃圾收集的速度赶得上对象分配的速度即可。
参考:
[1] 周志明. 深入理解 Java 虚拟机(第3版).