在JVM规范的描述中,除了PC外,虚拟机内存的其他几个运行时区域都有发生OutOfMemoryError
(OOM)异常的可能性。为了对这些异常进一步理解,我们将通过若干实例来验证异常发生的场景,并且会介绍几个与内存相关的最基本的虚拟机参数。
其实写记录这篇文章的原因有2个:
- 通过代码验证Java虚拟机规范中描述的各个运行时区域存储的内容;
- 希望以后在工作中遇到实际的内存溢出异常是,能根据异常的信息快速判断是那个区域的内存溢出,知道什么样的代码可能会导致这些区域内存溢出,以及出现异常后该如何处理。
首先,为了避免每次启动程序都需要手动敲入JVM参数,我们用Intellij IDEA来测试,并且在RUN/DEBUG Configurations---VM options
中键入(参数说明请看这里:JVM-参数分析)
-verbose:gc -Xms20M -Xmx20M -Xmn10M
-XX:+PrintGCDetails -XX:SurvivorRatio=8
如下图。
Java堆溢出
Java堆用于存储对象实例,只要不断地创建对象,并且保证GC Roots到对象之间有可达路径来避免GC来清除这些对象,那么在对象数量达到最大堆的容量限制后就回产生内存溢出异常。
在下面的代码中,我们限制饿了Java堆的大小为20M,不可扩展(将堆的初始值-Xms与最大值-Xmx参数设置为一样即可避免堆自动扩展),通过参数-XX:+HeapDumpOnOutOfMemoeyError
可以让虚拟机在出现内存溢出异常时Dump出当前的内存堆转储快照以便事后进行分析。
输出结果:
Java堆内存的OOM异常是实际应用中常见的内存溢出异常情况。当出现Java堆内存溢出异常时,异常堆栈信息java.lang.OutOfMemoryError
会跟着进一步提示Java heap space
。
要解决这个区域的异常,一般的手段是先通过内存映像分析工具Jstat工具来分析下。首先找到堆转储文件java_pid23366.hprof,默认在工程的根目录下,也可以通过-XX:+HeapDumpOnOutOfMemoeyError=< file-path >来指定。然后运行jstat java_pid23366.hprof
,jstat分析完成后会生成html文件并启动服务器,我们访问默认端口localhost:7000打开分析结果页面,默认会显示功能列表,我们主要关注的是有多少个实例存在导致了内存异常,所以我们点击链接Show instance counts for all classes (excluding platform)
。如下图。
然后会调到下面这个页面,从这张图中我们可以很清晰的看见堆中竟然存在810326个OOMObject对象,由此问题的根源就显而易见了。
除了用jstat这个命令行工具外,我们还可以使用jvisualvm这个可视化工具来分析,只要把.hprof文件导入进去就可以了。如下图。
如果是内存泄露,可进一步通过工具查看泄露对象到GC Roots的引用链。于是就能找到泄露对象是通过怎样的路径与GC Roots相关联并导致GC无法自动回收它们的。掌握了泄露对象的类型信息及GC Roots引用链的信息,就可以比较准确地定位出泄露代码的位置。
如果不存在泄露,换句话说,就是内存中的对象确实都还必须存活着,那就应当检查虚拟机的参数(-Xms与-Xmx),与物理机内存对比看是否还可以调大,从代码检查是否存在某些对象生命周期过长、持有状态时间过长的情况,尝试减少程序运行时期的内存消耗。
虚拟机栈和本地方法栈溢出
由于在HotSpot虚拟机中不区分虚拟机栈和本地方法栈,因此,对于HotSpot来说,虽然-Xoss参数(设置本地方法栈大小)存在,但是毫无意义,栈容量只由-Xss参数设定。关于虚拟机栈和本地方法栈,在Java虚拟机规范中描述了2中异常:
- 如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出StackOverflowError异常;
- 如果虚拟机在扩展时无法申请到足够的内存空间,将抛出OutOfMemoryError异常;
这里把异常分为2中情况,看似更加严谨,但却存在一些互相重叠的地方:当栈空间无法继续分配时,到底是内存太小,还是已使用的栈空间太大,其本质上都是对同一件事情的两种描述而已。
在实验中,将范围限制于单线程中的操作,尝试了下面2中方法均无法让虚拟机产生OutOfMemoryError异常,尝试的结果都是获得StackOverflowError异常,测试代码如下:
- 使用-Xss参数减少栈内存容量。结果:抛出StackOverflowError异常,异常出现时将输出栈的深度;
- 定义了大量的本地变量,增大此方法帧中本地变量表的长度,结果:抛出StackOverflowError异常。
|
|
输出结果:
结果表明:在单个线程的情况下,无论是由于栈帧太大还是虚拟机栈容量太小,当内存无法分配的时候,虚拟机抛出的都是StackOverflowError异常。
方法区和运行时常量池溢出
由于运行时常量池是方法区的一部分,因此这2个区域的溢出测试就放在一齐进行。之前说过JDK1.7开始逐步”去永久代”的事情,在此就以测试代码观察一下这件事对程序的实际影响。
String.intern()是一个native方法,它的作用是:如果字符串常量池中已经包含了一个等于此String对象的字符串,则返回代表池中这个字符串的String对象;否则,将此String对象包含的字符串添加到常量池中,并且返回此String对象的引用。在JDK1.6及之前的版本中,由于常量池分配在永久代中,我们可以通过-XX:PermSIze
和-XX:MaxPernSize
限制方法区大小,从而间接限制其中常量池的容量。
运行结果:
从运行结果中可以看出,运行时常量池溢出,在OutOfMemoryError后面跟随的提示信息是”PermGen space“,说明运行时常量池属于方法区(HotSpot虚拟机中的永久代)的一部分。
而使用JDK1.7运行这段程序就不会等到相同的结果,while循环将一直循环下去。关于这个字符串常量池的实现问题,还可以引申出一个有意思的影响,看如下代码:
JDK1.6运行结果:
JDK1.7运行结果:
分析:
在1.6中,intern()方法会把首次遇到的字符串实例复制到常量池中,返回的也是常量池中的这个字符串实例的引用,而StringBuilder创建的字符串在堆上,所有必然不是同一个引用,所以2个都是false。
而在1.7中,intern()实现不会再复制,只是在常量池中记录首次出现的实例引用,因此intern()返回的引用和由StringBuilder创建的那个字符串是同一个。对于str2比较返回是false是因为”java”这个字符串在执行StringBuilder.toString()之前已经出现过(???哪里出现了卧槽,虚拟机加载的关键字么,可是pack+age还是返回true啊),字符串常量池已经有它的引用了,不符合“首次出现”的原则,而“计算机软件”这个字符串是首次出现的。
方法区用于存放Class的相关信息,如类名、访问修饰符、常量池、字段描述、方法描述等。对于这些区域的测试,基本的思路是运行时生成大量的类去填满方法区,直到溢出。虽然直接使用Java SE API也可以动态产生类(如反射时的GeneratedConstructorAccessor和动态代理等),但我们这次使用CGLib直接操作字节码运行时生成大量的动态类。
运行结果:
值得注意的是,我们在这个例子中的模拟场景并不是一个纯碎的实验,这样的应用经常会出现在实际的应用之中:当前很多主流的框架,如Spring、Hibernate,在对类进行增强的时候,都是使用CGLib这类字节码技术,增强的类越多,就需要越大的方法区来保证动态生成的Class可以载入内存。
方法区溢出也是一种常见的内存溢出异常,一个类要被GC回收掉,判定条件是比较苛刻的。在经常动态生成大量Class的应用中,需要特别注意类的回收情况。这类场景除了CGLib字节码增强之外,常见的还有:大量JSP或动态产生JSP文件的应用(JSP第一次运行需要被编译为Java类)、基于OSGi的应用(即使是同一个类文件,被不同的类加载器加载会视为不同的类)等。