深入了解Java虚拟机笔记(一):运行时数据区域
一、运行时数据区域
1.程序计数器(Program Counter Register)
程序计数器是一块较小的内存空间,作用是当前线程所执行的字节码的行号指示器
。在虚拟机概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令。
由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任一确定时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。因此为了线程切换后能恢复到正确的执行位置,每条线程都需要一个独立的程序计数器,各线程间计数器互不影响,独立存储,这类内存区域被称为“线程私有”的内存。
若线程执行的是Java方法,计数器记录的是正在执行的虚拟机字节码指令的地址;若执行Native方法,这个计数器值则为空(Undefined)。这个程序计数器内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError的区域
。
2.Java虚拟机栈(Virtual Machine Stacks)
线程私有
,生命周期和线程相同。每个方法被执行的时候会同时创建一个栈帧(Stack Frame)用于存储局部变量表、操作栈、动态链接、方法出口等信息
。每一个方法被调用直至执行完成的过程,就对应一个栈帧在虚拟机中入栈到出栈的过程。通常说的栈就是这个虚拟机栈,或者说是虚拟机栈中的局部变量表。(栈帧是方法运行期的基础数据结构)
局部变量表存放了编译期可知的各种基本数据类型和对象引用。 64位长度的long和double类型的数据会占用2个局部变量空间(Slot),局部变量表所需要的内存空间在编译期完成分配,当进入一个方法时,该方法需要在帧中分配多大的局部变量空间是完全确定的,方法运行期间不会改变局部变量表的大小
。
异常:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverFlowError异常;如果虚拟机栈可以动态扩展(虚拟机规范允许固定长度或动态),扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常。
3.本地方法栈(Native Method Stacks)
线程私有
,和虚拟机栈作用相似,区别是虚拟机栈为虚拟机执行Java方法(字节码)服务,而本地方法是为虚拟机使用到的Native方法服务。
异常:同样会抛出Stack Overflow和OutOfMemoryError。
4.Java堆(Java Heap)
线程共享
,在虚拟机启动的时候创建,Java虚拟机中所管理的内存中最大的一块。此内存区域唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存
。
堆是垃圾收集器管理的主要区域,因此很多时候也被称为“GC堆”,如果从内存回收的角度来看,由于垃圾收集器基本采用分代收集算法,所以Java堆还可以细分为:新生代和老年代;如果从内存分配的角度看,线程共享的堆可能划分出多个线程私有的分配缓冲区
(Thread Local Allocation Buffer,TLAB)。
根据虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上连续即
可。在实现时,既可以实现成固定大小,也可以是扩展的(主流)。如果堆中没有内存完成实例分配,并且堆无法再扩展时,将会抛出OutOfMemoryError。
5.方法区(Method Area)
线程共享,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译期编译后的代码等数据
。虽然虚拟机规范把方法区描述为堆的一个逻辑部分,但是它有一个别名叫Non-Heap(非堆)。
方法区和永久代并不等价,只是HotSpot虚拟机设计团队选择把GC分代收集扩展至方法区,或者说使用永久代来实现方法区而已(方法区是一种规范,永久代是方法区的一种实现)。
方法区的限制十分宽松,除了和堆一样不需要连续的物理内存和可以选择固定扩展大小外,还可以选择不实现垃圾收集。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载
,一般方法区的回收比较难以令人满意,尤其是类型卸载,条件相当苛刻,但是这部分区域的回收确实是有必要的。当方法区无法满足内存分配需求时,将抛出OutOfMemoryError。
5.1 运行时常量池(Runtime Constant Pool)
方法区的一部分,Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后存放在方法区的运行时常量池中
。
Java虚拟机对Class文件的每一部分格式都有严格的规定,但对于运行时常量池没有任何细节的要求,不同的虚拟机可以按照自己的需要来实现这个内存区域。不过,一般来说,除了保存Class文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池中
。
运行时常量池相对于Class文件常量池的另外一个重要特征是具备动态性
,运行期间也可能将新的常量放入池中,这种特性被利用的较多的便是String类的intern()方法。既然运行时常量池是方法区的一部分,自然受到方法区的内存限制,也会在无法申请到内存时抛出OutOfMemoryError。
5.2.常量池的好处
常量池是为了避免频繁的创建和销毁对象而影响系统性能,实现了对象的共享。例如字符串常量池,在编译阶段就把所有的字符串文字放到一个常量池中。
节省内存空间:常量池中所有相同的字符串常量被合并,只占用一个空间。
节省运行时间:比较字符串时,比equals()快。对于两个引用变量,只用判断引用是否相等,也就可以判断实际值是否相等。
5.3基本类型的包装类和常量池
java中基本类型的包装类的大部分都实现了常量池技术,即Byte,Short,Integer,Long, Character, Boolean。这5种包装类默认创建了数值[-128,127]的相应类型的缓存数据,但是超出此范围仍然会去创建新的对象
。 两种浮点数类型的包装类Float,Double并没有实现常量池技术。
6.其他
直接内存(Direct Memory):并不是虚拟机运行时数据区的一部分,也不是Java虚拟机中定义的内存区域,但是配置虚拟机参数时忽略直接内存也可能会导致动态扩展时出现OutOfMemoryError
。
JDK 1.7开始移除方法区(永久代),运行时常量池和字符串常量池都在堆中。JDK1.8后,使用直接内存作为元空间来实现方法区,字符串常量池仍在堆中。
JDK1.7中,存储在永久代的部分数据就已经转移到了Java Heap或者是 Native Heap,但永久代仍存在于JDK1.7中,并没完全移除,譬如符号引用(Symbols)转移到了native heap;字面量(interned strings)转移到了java heap,类的静态变量(class statics)转移到了java heap,元空间仅仅存储类的元数据。
元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存
。因此,默认情况下,元空间的大小仅受本地内存限制。
永久代缺点:
-
永久代的大小是在启动时固定好的,很难进行调优。且类的回收判定较为苛刻回收效率低下,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出
-
字符串在永久代中,容易出现性能问题和OOM
-
永久代会为 GC 带来不必要的复杂度,并且回收效率偏低
-
Oracle 可能会将HotSpot 与 JRockit 合二为一
元空间特点
-
每个加载器有专门的存储空间
-
不会单独回收某个类
-
元空间里的对象的位置都是固定的
-
如果GC发现某个类加载器不再存活了,会把相关的空间整个回收掉