Java JVM

JVM体系结构

虚拟机是无力及其德软件实现。Java的开发遵循write once run anywhere(“一次编写到处乱跑”)理念,它运行在VM(虚拟机)上。编译器将Java文件编译成Java.class文件,之后,将.class文件输入到JVM中,加在并执行该类文件。下图为JVM的体系结构

Java JVM

JVM各个模块简介

  • 运行时数据区:经过编译生成的字节码文件(class文件),由classloader(类加载子系统)加载后交给执行引擎执行。在执行引擎执行的过程中产生的数据会存储在一块内存区域。这块内存区域就是运行时区域
  • 程序计数器:由于纪录当前线程的正在执行的字节码指令位置。由于虚拟机的多线程是切换线程并分配cpu执行时间的方式实现的,不同线程的执行位置都需要记录下来,因此程序计数器是线程私有的
  • 虚拟机栈:虚拟机栈是Java方法执行的内存结构,虚拟机会在每个Java方法执行时创建一个“栈帧”,用于存储局部变量表,操作数栈,动态链接,方法出口等信息。当方法执行完毕时,该栈帧从虚拟机栈中出栈。其中局部变量包含基本数据类型和对象引用。
    • 在Java虚拟机规范中,对这个区域规定了两种异常状态:如果线程请求的栈的深度大于虚拟机允许的深度,将跑出StackOverFlowError异常(栈溢出),如果虚拟机栈可以动态扩展(现在大部分Java虚拟机都可以动态扩展,只不过Java虚拟机规范中也允许固定长度的Java虚拟机栈),如果扩展时无法申请到足够的内存空间,就会抛出OutOfMemoryError异常(没有足够的内存)
  • 本地方法栈:类似Java方法的执行有虚拟机栈,本地方法的执行则对应有本地方法栈
  • 方法区:用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。线程共享(看存储的数据就知道了)
  • Java堆(Heap):堆的主要作用是存放程序运行过程中创建的对象实例,因为要存放的对象实例有可能会极多,因此也是虚拟机内存管理中最大的一块。并且由于硬件条件有限,所以需要不断回收已“无用”的实例对象来腾出空间给新生成的实例对象;因此Java的垃圾回收主要是针对堆进行回收的(还有方法区的常量池),Java堆很多时候也被称为GC堆(Garbage Collected Heap)。
  • 类加载机制(Class Loader):类加载子系统是根据一个的全限定名来加载该类的二进制流到内存中,在JVM中将形成一份描述Class结构的元信息对象(方法区),通过该元信息对象可以获知Class的结构信息:如构造函数,属性和方法等,Java允许用户借由这个Class相关的元信息对象间接调用Class对象的功能。

JVM是如何工作的

如上面的体系结构图所示,JVM分为三个主要的子系统:

  1. 类加载器子系统
  2. 运行时数据区
  3. 执行引擎

类加载器子系统

Java的动态类加载功能是由类加载器子系统处理的。它负责加载、链接,并且在运行时首次引用类的时候初始化类,而不是在编译期间。

加载

这个组件负责加载类。BootStrap类加载器、Extension类加载器和Application类加载器是实现这个功能的三大类加载器。

  • BootStrap类加载器——负责从classpath加载类,如果没有类存在,将只加载rt.jar。这个加载器的优先级最高;
  • Extension类加载器——负责加载**扩展文件夹(jre\lib)**中的类;
  • Application类加载器——负责加载应用级classpath和环境变量指向的路径下的类。

上述类加载器在加载类文件时遵循委托层次结构算法。

链接

  • 校验——字节码验证器将校验生成的字节码是否正确,如果校验失败,我们将获得校验错误信息;
  • 准备——对于所有的静态变量,内存将被申请并分配默认值;
  • 解析——所有标记的内存引用从方法区域被替换成的原始引用。

初始化

这是类加载的最后阶段,所有的静态变量都将被分配原值,静态代码块将被执行。

运行时数据区被划分为五个主要部分:

  • 方法区——所有类级数据都将存储在这里,包括静态变量。每一个JVM只有一个方法区,并且它是一个共享资源。
  • 堆区——所有对象及其对应的实例变量和数组等存储在此,每个JVM同样只有一个堆区。由于方法区和堆区是多线程内存共享,因此存储的数据是非线程安全的。
  • 栈区——每个线程都会创建一个单独的运行时栈。在每一次方法调用,都会在栈内存中创建一个栈帧(Stack Frame)。所有局部变量将在栈内存中创建。栈区是线程安全的,因为它不是一个共享资源。栈帧可以被划分为三个实体:
    • 局部变量数组:与方法中有多少局部变量有关,相应的值将存储在此处
    • 操作数栈:如果任何的中间操作需要被执行,操作数栈将作为运行时工作区来执行操作
    • 帧数据:与方法相对应的所有符号存储在此,在任何异常情况下,catch块的信息被保留在帧数据中
  • PC寄存器——每一个线程都有单独的PC寄存器,一旦执行指令,PC寄存器将被下一条指令更新,保存当前执行指令的地址。
  • 本地方法栈——本地方法栈保存本地方法信息,每一个线程都会创建一个单独的本地方法栈。

执行引擎

分配到运行时数据区的字节码将被执行引擎执行,执行引擎读取字节码并逐一执行。

  • 解释器——解释器能更加快速地解释字节码,但是执行缓慢。解释器的缺点是当多次调用一个方法时,每次都要重新解释。
  • JIT编译器——JIT编译器弥补了解释器的不足,执行引擎使用解释器来转换字节码,当它发现重复的代码时,它将使用JIT编译器来编译整个字节码并转换为本地代码。本地代码将直接被重复的方法所调用,从而提高系统性能。
  • 中间代码生成器——生成中间代码。
  • 代码优化器——负责优化上述生成的中间代码。
  • 分析器——一个特殊的组件,负责查找热点代码,比如一个方法是否被调用多次。
  • 垃圾回收器——回收并删除未引用的对象,可以通过**System.gc()**来触发垃圾回收,但不能保证它执行。JVM的垃圾回收是回收被创建的对象。

Java本地接口(JNI):JNI与本地方法库交互,并为执行引擎提供本地方法库。

本地方法库(Native Method Libraries):它是执行引擎所需的本地库集合。

运行时数据区域

Java JVM

程序计数器(线程私有)

记录正在执行的虚拟机字节码指令的地址(如果正在执行的是本地方法则为空)。

  • 多个线程竞争时被挂起,程序计数器记录执行到哪里
  • 唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域

虚拟机栈(线程私有)

每个Java方法在执行的同时会创建一个栈帧用于存储局部变量表、操作数栈、常量池引用等信息,从调用直至完成的过程,就对应着一个栈帧在Java虚拟机栈中入栈和出栈过程。

Java JVM

  • 补充:栈帧中还存在动态链接、出口(返回地址)等。

可以通过-Xss这个虚拟机参数来指定一个程序的Java虚拟机栈内存大小:

java -Xss=512M HackTheJava

该区域可能抛出以下异常:

  • 当线程请求的栈深度超过最大值,会抛出StackOverflowError异常:
  • 栈进行动态扩展时如果无法申请到足够内存,会抛出OutOfMemoryError异常。

本地方法栈(线程私有)

本地方法一般是用其他语言(C、C++或汇编语言等)编写的,并且被编译为基于本机硬件和操作系统的程序,对待这些方法需要特别处理。

本地方法栈与Java虚拟机栈类似,它们之间的区别只不过是本地方法栈为本地方法服务。

Java JVM

所有对象实例都在这里分配内存。

是垃圾收集的主要区域(“GC堆”)。现代的垃圾收集器基本都是采用分代收集算法(因为对象的生命周期不一样),主要思想是针对不同的对象采取不同的垃圾回收算法。虚拟机把Java堆分成以下三块: