JVM-运行时数据区域

Java 的内存区域划分绝不仅仅只是堆内存(heap)和栈内存(Stack),实际上 JVM 在执行 Java 程序的过程中会把它所管理的内存划分为以下几个数据区域:程序计数器、Java 虚拟机栈、本地方法栈、堆、方法区、运行时常量和直接内存。如下图所示:

Runtime DataArea

一、程序计数器(PC Register)

程序计数器(PC Register)是最小的一块内存区域,它的作用是记录正在执行的虚拟机字节码指令的地址。在虚拟机的模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、异常处理、线程恢复等基础功能都需要依赖计数器完成。

  • 每一个 Java 线程都有一个程序计数器,用以记录比如在线程切换回来后恢复到正确的执行位置。
  • 如该线程正在执行一个 Java 方法,则计数器记录的是正在执行的虚拟机字节码地址,如执行 Native 方法,则计数器值为空。
  • 此内存区域是唯一一个在 JVM 中没有规定任何 OutOfMemoryError 情况的区域。

二、Java 虚拟机栈(JVM Stacks)

每个 Java 方法在执行的同时会创建一个 “栈帧” 用于存储局部变量表(包括参数)、操作数栈(执行引擎计算时需要)、常量池引用、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在 Java 虚拟机栈中入栈和出栈的过程。JVM 栈是线程私有的,并且生命周期与线程相同。并且当线程运行完毕后,相应内存也就被自动回收

局部变量表 存放了编译器可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(引用指针,并非对象本身),其中 64 位长度的 long 和 double 类型的数据会占用 2 个局部变量的空间,其余数据类型只占 1 个。

局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在栈帧中分配多大的局部变量是完全确定的,在运行期间栈帧不会改变局部变量表的大小空间。

可以通过虚拟机参数 -Xss(例如:java -Xss=512M HackTheJava)来指定一个程序的 Java 虚拟机栈内存大小。

当线程请求的栈深度大于虚拟机所允许的深度,会抛出 StackOverflowError 异常(如:将一个函数反复递归自己,最终会出现这种异常);如果 JVM 栈可以动态扩展(大部分 JVM 是可以的),当扩展时无法申请到足够内存,则会抛出 OutOfMemoryError 异常。

三、本地方法栈(Native Method Stacks)

本地方法不是用 Java 实现,对待这些方法需要特别处理。与 Java 虚拟机栈类似,它们之间的区别只不过是本地方法栈为本地方法服务。和 JVM 栈一样,这个区域也会抛出 StackOverflowErrorOutOfMemoryError 异常。

四、堆(Heap)

堆(Heap)也叫做 Java 堆,GC 堆,是 Java 虚拟机所管理的内存中最大的一块内存区域,也是被各个线程共享的内存区域,在 JVM 启动时创建。该内存区域存放了对象实例 (所有 new 的对象)及数组,JIT 编译器貌似不是这样的。根据 Java 虚拟机规范的规定,Java 堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。

其大小通过 - Xms(最小值)和 -Xmx(最大值)参数设置(例如:java -Xms=1M -Xmx=2M HackTheJava),-Xms 为 JVM 启动时申请的最小内存,默认为操作系统物理内存的 1/64 但小于 1G,-Xmx 为 JVM 可申请的最大内存,默认为物理内存的 1/4 但小于 1G,默认当空余堆内存小于 40% 时,JVM 会增大 Heap 到 -Xmx 指定的大小,可通过 - XX:MinHeapFreeRation 来指定这个比列;当空余堆内存大于 70% 时,JVM 会减小 heap 的大小到 -Xms 指定的大小,可通过 XX:MaxHeapFreeRation 来指定这个比列,对于运行系统,为避免在运行时频繁调整 Heap 的大小,通常 -Xms-Xmx 的值设成一样。

如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出 OutOfMemoryError 异常。

Java 堆是垃圾收集管理的主要战场,现代的垃圾收集器基本都是采用分代收集算法,该算法的思想是针对不同的对象采取不同的垃圾回收算法,因此虚拟机把 Java 堆分成以下三块:新生代(Young Generation)、老年代(Old Generation)、永久代(Permanent Generation)。

4.1 新生代

程序新创建的对象都是从新生代分配内存,新生代存放着大量的生命很短的对象,因此新生代在三个区域中垃圾回收的频率最高。为了更高效地进行垃圾回收,把新生代继续划分成以下三个空间:Eden、From Survivor、To Survivor。

可通过 - Xmn 参数来指定新生代的大小,也可以通过 - XX:SurvivorRation 来调整 Eden Space 及 Survivor Space 的大小。

4.2 老年代

老年代用于存放经过多次新生代 GC 任然存活的对象,例如缓存对象。新建的对象也有可能直接进入老年代,主要有两种情况:

  • 大对象,可通过启动参数设置 - XX:PretenureSizeThreshold=1024(单位为字节,默认为 0)来代表超过多大时就不在新生代分配,而是直接在老年代分配。
  • 大的数组对象,且数组中无引用外部对象。

老年代所占的内存大小为 - Xmx 对应的值减去 - Xmn 对应的值。

4.3 永久代

永久代是 Hotspot 虚拟机特有的概念,是方法区的一种实现,别的 JVM 都没有这个东西。在 Java 8 中,永久代被彻底移除,取而代之的是另一块与堆不相连的本地内存——元空间。 永久代或者 “Perm Gen” 包含了 JVM 需要的应用元数据,这些元数据描述了在应用里使用的类和方法。注意,永久代不是 Java 堆内存的一部分。永久代存放 JVM 运行时使用的类。永久代同样包含了 Java SE 库的类和方法。永久代的对象在 Full GC 时进行垃圾收集。

五、方法区(Method Area)

方法区(Method Area)也称 “永久代”、“非堆”,它用于存储虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据,如:当程序中通过 getName、isInterface 等方法来获取信息时,这些数据来源于方法区。方法区是各个线程共享的内存区域,比如每个线程都可以访问同一个类的静态变量。默认最小值为 16MB,最大值为 64MB,可以通过 - XX:PermSize 和 -XX:MaxPermSize 参数限制方法区的大小。

和 Java 堆一样不需要连续的内存,并且可以动态扩展,动态扩展失败一样会抛出 OutOfMemoryError 异常。

由于使用反射机制的原因,虚拟机很难推测哪个类信息不再使用,因此这块区域的回收很难,对这块区域进行垃圾回收的主要目标是对常量池的回收和对类的卸载。方法区并不等同于永久代,只是因为 HotSpot VM 使用永久代来实现方法区,对于其他的 Java 虚拟机,比如 J9 和 JRockit 等,并不存在永久代概念。

六、运行时常量池(Runtime Constant Pool)

运行时常量池(Runtime Constant Pool)是方法区的一部分,值得注意的是 JDK1.7 已经把常量池转移到堆里面了。Class 文件中的常量池(编译器生成的各种字面量和符号引用)会在类加载后被放入这个区域。运行时常量池可以理解为是类或接口的常量池的运行时表现形式。除了在编译期生成的常量,还允许动态生成,例如 String 类的 intern()。这部分常量也会被放入运行时常量池。

当创建类或接口时,如果构造运行时常量池所需的内存超过了方法区所能提供的最大值,Java 虚拟机会抛出 OutOfMemoryError 异常。

七、直接内存(Direct Memory)

在 JDK 1.4 中新加入了 NIO 类,它可以使用 Native 函数库直接分配堆外内存,然后通过一个存储在 Java 堆里的 DirectByteBuffer 对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在 Java 堆和 Native 堆中来回复制数据。