JVM类加载机制
我们都知道自己编写的Java程序编译成".class"文件后是需要加载到虚拟机中之后才能运行和使用。那么虚拟机是如何加载这些class文件的呢?
类的生命周期
类从被加载到虚拟机开始,到卸载出内存为止,它的整个生命周期包括:加载、验证、准备、解析、初始化、使用和卸载7个阶段。
加载–>验证–>准备–>初始化–>卸载,这五个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班的开始。
虚拟机规范中严格规定了有且只有5种情况必须立即对类进行"初始化":
(1)遇到字节码指令:
- new(new 关键字实例化对象)
- getstatic,putstatic(读取,设置一个类的静态字段,被final修饰、已在编译期把结果放入常量池的静态字段除外)
- invokestatic(调用一个静态方法的时候)
如果类未初始化,则需先触发其初始化
(2)使用java.lang.reflect包的方法对类进行反射调用的时候
(3)当初始化一个类,发现其父类还没有进行初始化,那么先触发父类的初始化
注意:接口在初始化时,并不要求其父接口全部都完成初始化
(4)当虚拟机启动,执行main方法的类时,先初始化这个主类
(5)当使用JDK1.7动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果 REF_getStatic、REF_putStatic、REF_invokeStatic 的方法句柄,并且这个方法对应的类没有进行初始化
以上五种场景中的行为称为对一个类进行主动引用
除了上述情况之外,所有引用类的方式都不会触发初始化,称为被动引用
(1)通过子类引用父类的静态字段,不会导致子类初始化
(2)通过数组定义类引用类,不会触发此类的初始化
(3)常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化
类的加载过程
1.加载
这个阶段虚拟机需要完成的3件事情
(1)通过一个类的全限定名来获取定义此类的二进制字节流
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
(3)在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口
二进制字节流获取方式:
(1)从ZIP包中读取,(JAR、EAR、WAR)
(2)从网络中获取,(场景:Applet)
(3)运行时计算生成,(动态代理技术)
(4)由其他文件生成(JSP应用)
(5)从数据库中读取(少见,像有些中间件服务器)
数组类本身不通过类加载器创建,由Java虚拟机直接创建的,但数组内的元素还是通过类加载器去创建
2.验证
为了确保Class文件的字节流中包含的信息符合当前虚拟机要求,并且不会危害虚拟机自身的安全
4个校验动作:
(1)文件格式验证
- 是否以魔数0xCAFEBABE开头
- 主次版本号是否在当前虚拟机处理范围之内
- 常量池中的常量是否有不被支持的常量类型
- 指向常量的各种索引值是否指向不存在的常量或不符合类型的常量
- CONSTANT_Utf8_info型的常量是否有不符合UTF8编码的数据
- Class文件中各个部分及文件本身是否有被删除的或附加的其他信息
(2)元数据验证:对类的元数据信息进行语义校验,保证不存在不符合Java语言规范的元数据信息
- 这个类是否有父类
- 这个类的父类是否继承了不允许被继承的类(被final修饰的类)
- 如果这个类不是抽象类,是否实现了其父类或接口中要求的实现的所有方法
- 类中的字段、方法是否与父类产生矛盾
(3)字节码验证:
通过数据流和控制流分析,确定程序语义是合法的、符号逻辑的
(4)符号引用验证
发生在虚拟机将符号引用转化为直接引用的时候(在解析阶段发生)
- 符号引用中通过字符串描述的全限定名是否能找到对应类
- 在指定类中是否存在符号方法的字段描述以及简单名称所描述的方法和字段
- 符号引用中的类、字段、方法的访问性是否可被当成类访问
确保解析动作能正常执行,NoSuchFieldError,NoSuchMethodError,IllegalAccessError
3.准备
为类变量(static 修饰的变量)分配内存并设置类变量初始值的阶段
通常情况下,初始值设置为数据类型的零值
数据类型 | 零值 |
---|---|
int | 0 |
long | 0L |
short | (short)0 |
char | ‘\u0000’ |
byte | (byte)0 |
boolean | false |
float | 0.0f |
double | 0.0d |
reference | null |
特殊情况:被final修饰的类变量,初始值为指定的值
public static final int value = 123;
4.解析
虚拟机将常量池内的符号引用替换为直接引用的过程
虚拟机规范中并未规定解析阶段发生的具体时间,只要求了在执行anewarray、checkcast、getfield、getstatic、instanceof、invokedynamic、invokeinterface、invokespecial、invokestatic、invokevirtual、ldc、ldc_w、multianewarray、new、putfield、putstatic 这16个操作符号引用的字节码指令之前,先对它们所使用的符号引用进行解析
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行
5.初始化
初始化阶段是执行类构造器()方法的过程
- <clinit>()方法是编译器自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并产生的,收集顺序按照在源文件中出现的顺序;static{}块中只能访问到定义在语句块之前的变量,定义在之后的变量,可以赋值不能访问
- <clinit>()与类的构造函数不同,它不需要显式地调用父类构造器,虚拟机会保证在子类 <clinit>() 方法执行之前,父类 <clinit>() 方法已经执行完毕。因此在虚拟机中第一个被执行的<clinit>()方法的类肯定是 Object类
- <clinit>() 对于类或接口不是必须的,如果类中没有静态代码块,也没有对变量赋值,那么编译器可以不为这个类生产<clinit>()方法
- 接口中不能有静态语句块,但仍然有变量初始化的赋值操作,因此接口与类一样都会生成<clinit>()方法。
- 虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确的加锁、同步。如果多个线程同时去初始化一个类,那么只有一个线程去执行这个类的<clinit>()方法,其他线程都需要阻塞等待,直到活动线程执行<clinit>()方法完毕。如果在一个类的<clinit>()方法中有耗时很长的操作,就可能造成多个进程阻塞(实际应用中这种阻塞往往很隐蔽)。如果执行<clinit>()方法的那条线程退出<clinit>()方法后,其他线程唤醒后不会再次进入<clinit>()方法。同一个类加载器下,一个类型只会初始化一次
类加载器
通过一个类的全限定名来获取描述此类的二进制字节流,实现这个动作的代码模块称为“类加载器”
对于任意一个类,都需要由加载它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性,每个类加载器,都拥有一个独立的类名称空间
类加载器:
- 启动类加载器(Bootstrap ClassLoader):
负责将存放在<JAVA_HOME>\lib目录中的,或者被-Xbootclasspath参数所指定的路径,并且是虚拟机识别的类库加载到虚拟机内存中 - 扩展类加载器
负责加载<JAVA_HOME>\lib\ext目录中,或者被java.ext.dirs系统变量所指定的路径中的所有类库 - 应用程序类加载器
负责加载用户类路径上所指定的类库
双亲委派模型:类加载器之间的层次关系
除了顶层的启动类加载器外,其余的类加载器都应有自己的父类加载器。这里加载器之间的父子关系一般不会以继承的关系来实现,而是都使用组合关系来复用父加载器的代码
工作过程:一个类加载器收到了类加载的请求,先把这个请求委派给父类加载器去完成,每一个层次的加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父加载器反馈无法完成这个加载时,子加载器才会尝试自己去加载
参考资料
- 《深入理解Java虚拟机:JVM高级特性与最佳实践》 by 周志明