快速入门JVM第一讲——JVM体系结构概述

相信学过Java的同学,都应该晓得JVM,它几乎是面试中必问的知识点。要想成为一名合格的Java程序员,JVM是你必须要掌握的知识点,它的重要性就不言而喻了。笔者本人也只是刚刚好入了JVM的门槛,多少对它有了一定的了解,本文详细记录了笔者本人快速入门JVM的学习过程,希望对初次学习JVM的同学有一定的借鉴之处!

JVM体系结构

在讲述JVM体系结构之前,先来看如下几道面试题,你能解决几道面试题呢?

  • 请谈谈你对JVM的理解?Java8的虚拟机有什么更新?
  • 什么是OOM?(随之而来的问题:它是由什么原因引起的?你是怎么去定位的?又是怎么去解决的?)什么是StackOverflowError?有哪些方法分析?
  • JVM的常用参数调优你知道哪些?
  • 内存快照抓取和MAT(但凡出现了OOM,你是怎么去定位的?常用的工具就是MAT)分析DUMP文件知道吗?
  • 谈谈JVM中,对类加载器你的认识?

初次学习JVM的同学,想必都会很懵逼,这些面试题一个也不会啊!没有关系,如果你能跟随我的脚步快速入门JVM,那么相信在你心中一定知道了以上面试题的答案。
在讲述JVM体系结构之前,你还得知道JVM所处的位置,如下图所示。
快速入门JVM第一讲——JVM体系结构概述
从上图中我们可以看出,JVM是运行在操作系统之上的,它与硬件没有直接的交互,但凡JVM想要调用硬件的一些操作,它就得通过操作系统。
现在终于要讲到JVM的体系结构了,我先给出JVM的体系结构图,JVM的体系结构如下图所示。
快速入门JVM第一讲——JVM体系结构概述

类加载器

类装载器(ClassLoader)负责加载class文件,class文件在文件开头有特定的文件标示,并且ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定。
快速入门JVM第一讲——JVM体系结构概述
类装载器加载class文件之后,就会形成一个元数据模板(即Class),元数据模板中存放的是共性数据,你有没有想过元数据模板是放在哪儿?new出来的这些实例又是放在哪儿呢?这个问题先放在这儿,学到后面,你自然就知道答案了。
JVM虚拟机中自带的类加载器一共有四种,它们分别是:
快速入门JVM第一讲——JVM体系结构概述
讲到这儿,我也不接着往下面讲了,先看一个案例,你觉得下面的Java程序运行之后会输出什么呢?
快速入门JVM第一讲——JVM体系结构概述
以上Java程序运行之后输出为null,为什么会这样呢?因为Object类是由启动类加载器加载进内存的,而启动类加载器不是Java的,是C++的,所以获得到的结果为null。
在学习类加载器时,我们肯定会学一个双亲委派机制,啥是双亲委派机制呢?即自顶向下加载,这样可以保证代码的安全性,防止恶意代码对源代码的修改。说得大白话一点,就是但凡出问题了,别来找我,找我爸,一层一层往上找,如下图所示。
快速入门JVM第一讲——JVM体系结构概述
下面我会举一个案例,来加深对双亲委派机制的理解。你觉得下面的Java程序运行之后会输出什么呢?
快速入门JVM第一讲——JVM体系结构概述
以上Java程序运行之后输出的结果如下图所示。
快速入门JVM第一讲——JVM体系结构概述
从以上运行结果中,我们可以清楚地看到JVM中类加载器的层级结构,即自顶向下依次是些什么类加载器。
在学习类加载器时,我们还会学一个沙箱安全机制,啥是沙箱安全机制呢?即保护程序安全的。说得大白话一点,就是保护自己的原生JDK的那些代码。这里我也会举个例子来加深对沙箱安全机制的理解。在我们本机上安装的JDK中有一个原生的String类,这一点可以从下图中看出来。
快速入门JVM第一讲——JVM体系结构概述
如果我们同样自定义一个String类,就像下图所示的那样。
快速入门JVM第一讲——JVM体系结构概述
运行以上程序时,发现报错了,这正是因为沙箱安全机制引起的,也就说明了它保护了原生JDK的那些代码。

执行引擎

执行引擎(Execution Engine)负责解释命令,并提交给操作系统执行。

Native

Native Interface(本地接口)

本地接口的作用是融合不同的编程语言为Java所用,它的初衷是融合C/C++程序,Java诞生的时候是C/C++横行的时候,它要想立足,就必须要调用C/C++程序,于是就在内存中专门开辟了一块区域处理标记为native的代码,它的具体做法是Native Method Stack中登记native方法,在Execution Engine执行时加载native libraies。
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理生产设备,在企业级应用中已经比较少见了。因为现在的异构领域间的通信很发达,比如可以使用Socket通信,也可以使用WebService等等,故在这里并不多做介绍。

Native Method Stack(本地方法栈)

上面已经讲过了,Java在诞生时就在内存中专门开辟了一块区域处理标记为native的代码,它的具体做法是Native Method Stack中登记native方法,在Execution Engine执行时加载本地方法库。
对此,我的理解是:本地方法栈(Native Method Stack)限定只有标注了native的方法才能塞进去。塞进去的方法但凡想要被执行,就只能求助于操作系统,然后调本地方法接口(操作系统的),调用本地方法接口时还需要本地方法库(类似于jar包,即dll动态连接库)的支持,最后,本地方法想要运行,还得把这个方法先做一个入栈的操作。
你试着想一下下面的Java程序运行到new Thread().start();这儿时,新的线程起来了没有呢?
快速入门JVM第一讲——JVM体系结构概述
答案是不确定线程起来没起来!因为是操作系统去起这个线程,这跟什么语言是无关的。如果你有心的话,那么可以查看一下Thread类的start()方法的源码,会发现其中有一个start0()方法的声明,而它就是一个native方法。
快速入门JVM第一讲——JVM体系结构概述
但凡标注了native的方法(也即本地方法),Java是无能为力了,这不是Java能做的事情,要交给操作系统了,这是操作系统要做的事情。

PC寄存器

每个线程都有一个程序计数器,它是线程私有的,其实它就是一个指针,指向方法区中的方法字节码(用来存储指向下一条指令的地址,也即将要执行的指令代码),由执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不记。温馨提示:PC寄存器(程序计数器)不是用来做存储的,而是用来做计算的。
那么,PC寄存器到底在哪儿用呢?别急,后面我会介绍到!

方法区

方法区是被所有线程共享的,所有字段和方法字节码,以及一些特殊方法如构造函数、接口代码等也在此定义。简单说,所有定义的方法的信息都保存在该区域,此区属于共享区间。
类加载器把.class文件读到内存里面变成Class(元数据模板)之后,变成的Class(元数据模板)就存放在方法区里面,相应地,所有的Class(元数据模板)包含的信息都会放进去,包含的信息如下图所示。
快速入门JVM第一讲——JVM体系结构概述
小结:公共的不变的通通放到方法区中,而各自独有的放到堆或栈中。但是,实例变量存在堆内存中,和方法区无关。
这里有一个问题,什么才能把方法区这部分内存回收掉呢?在JVM停下来的时候,才会回收!除此之外,我们还得知道一点,那就是只要是所有线程共享的才可以回收或者优化,如果是线程私有的则便不可以被回收或者优化。

我们都知道,程序=数据结构+算法,但这是一个正确的废话。在真实开发中,真正的程序开发是这样色的:程序=业务需求+框架。讲到栈,必然要讲到数据结构,因为栈是数据结构中的一种,简单的数据结构有:
快速入门JVM第一讲——JVM体系结构概述
接下来,我会对栈做一个详细的介绍。

栈是什么呢?

栈是什么呢?栈也叫栈内存,主管Java程序的运行,是在线程创建时创建,它的生命期是跟随线程的生命期的,线程结束栈内存也就释放了,对于栈来说不存在垃圾回收问题,只要线程一结束该栈就Over了,它的生命周期和线程是一致的,且它是线程私有的。其中,8种基本类型的变量+对象的引用变量+实例方法都是在函数的栈内存中分配的。
你有没想过,栈存储什么呢?也就是说栈帧中主要存储的都是些什么玩意呢?啥是栈帧呢?说得通俗点,栈帧就相当于弹夹里面的一个一个子弹。
快速入门JVM第一讲——JVM体系结构概述
栈帧中主要保存3类数据,如下图所示。
快速入门JVM第一讲——JVM体系结构概述

栈的运行原理

栈中的数据都是以栈帧(Stack Frame)的格式存在的,栈帧是一个内存区块,是一个数据集,也是一个有关方法(Method)和运行期数据的数据集,当一个方法A被调用时就产生了一个栈帧F1,并被压入到栈中,A方法又调用了B方法,于是又产生栈帧F2并也被压入栈中,B方法又调用了C方法,于是又会产生栈帧F3被压入栈中,…。执行完毕后,先弹出F3栈帧,再弹出F2栈帧,再弹出F1栈帧…。
说白了,栈的运行原理就一句话,即先进后出或者后进先出。这里,我会举一个例子,以此加深对栈的运行原理的理解。观察以下Java程序,你能粗略地画出栈的内存示意图吗?
快速入门JVM第一讲——JVM体系结构概述
下图是我根据以上Java程序画出的栈的内存示意图,画的很丑,望大家见谅!
快速入门JVM第一讲——JVM体系结构概述
问题来了,你怎么知道执行完test02方法后,下面该执行谁呢?想一想,是不是应该有个从一个方法指向另一个方法的指针,这个指针就是PC寄存器(线程私有的,PC寄存器就在栈中)。
快速入门JVM第一讲——JVM体系结构概述
当一个方法被调用时便会产生了一个栈帧,并被压入到栈中,那么当一个栈帧出栈时,就相当于一个方法执行完毕了。更加详细的栈的内存结构如下图所示。
快速入门JVM第一讲——JVM体系结构概述
从上图中可以清楚地看出,在一个栈中有两个栈帧,栈帧2是最先被调用的方法,故先入栈,然后方法2又调用了方法1,故栈帧1处于栈顶的位置,栈帧2处于栈底,执行完毕后,依次弹出栈帧1和栈帧2,线程结束,栈即刻释放。可以得出结论:每执行一个方法都会产生一个栈帧,保存到栈(后进先出)的顶部,顶部栈就是当前的方法,该方法执行完毕后会自动将此栈帧出栈。
快速入门JVM第一讲——JVM体系结构概述

什么是StackOverflowError?有哪些方法分析?

知道了栈的运行原理之后,我们就可以解决一开始提出的一个面试题了,即什么是StackOverflowError?(随之而来的问题:它是由什么原因引起的?你是怎么去定位的?又是怎么去解决的?)有哪些方法分析?
如果在方法中自己调用自己,也即循环递归调用,在这种情况下就会一直往里压栈,一直不出栈,那么此时就会报java.lang.StackOverflowError的错了。
快速入门JVM第一讲——JVM体系结构概述
运行以上Java程序,你便可以在Eclipse控制台看到java.lang.StackOverflowError的错误信息了。
快速入门JVM第一讲——JVM体系结构概述
这时,我们可以定位到出现java.lang.StackOverflowError错误的那句代码处了,发现出现了循环递归调用的情况,知道原因就好解决了。温馨提示:java.lang.StackOverflowError这个错误,我们必须记下来,除此之外,还要搞清楚它到底是由什么原因引起的?我们该怎么去定位?怎么去解决?

栈、堆以及方法区之间的交互关系

栈、堆以及方法区之间的交互关系如下图所示。
快速入门JVM第一讲——JVM体系结构概述
有同学可能会问,HotSpot是个什么东西啊?HotSpot就是JDK的品牌名(产品名)。JVM就是一套规范,HotSpot就是根据JVM的这套规范生成的一个产品。你是不是在哪儿看到过这个东西呢?
快速入门JVM第一讲——JVM体系结构概述
这里,稍微简单了解一下Java(JDK)的发展历史,在Java发展的过程中,有三种JVM,它们分别是:
快速入门JVM第一讲——JVM体系结构概述