JVM探究
JVM探究
摘自:https://www.bilibili.com/video/BV1iJ411d7jS?t=191&p=13
-
请你谈谈对JVM的理解?
Java文件编译成Class文件,再在JVM中运行
-
Java8虚拟机和之前的变化更新
-
什么是OOM
-
什么是栈溢出StackOverFlowError?怎么分析
-
JVM的常用调优参数
-
内存快照如何抓取,怎么分析Dump文件
-
谈谈JVM中,类加载器的认识? rt-jar
- JVM的位置
- JVM的体系结构
- 类加载器
- 双亲委派机制
- 沙箱安全机制
- Native
- PC寄存器
- 方法区
- 栈
- 三种JVM
- 堆
- 新生区,老年区
- 永久区
- 堆内存调优
- GC(垃圾回收器)
- 常用算法
- JMM
一.JVM体系结构
.java -> ClassFile -> 类装载器(ClassLoader) ->运行时数据区(Runtime Date Area)
其中:栈,本地方法栈和程序计数器不会有垃圾回收
JVM调优:堆(大部分),方法区
二.类加载器和双亲委派机制
作用:加载Class文件
new Studet()
引用在栈里
真正对应的数据在堆里
分类
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序加载器
双亲委派机制
目的:保证安全
- 类加载器收到类加载的请求(Application)
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
- 启动类加载器检查是否能加载当前这个类,能加载就结束,使用当前的加载器,否则抛出异常通知子加载器进行加载
- 重复3
- 都找不到则报错ClassNotFound
三.沙箱安全机制
Java安全模型的核心就是Java沙箱(sandbox) ,
什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。
沙箱主要限制系统资源访问,那系统资源包括什么? CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱Sandbox)机制。如下图所示JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示JDK1.1安全模型
在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示
当前最新的安全机制实现,则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示最新的安全模型(jdk 1.6)
组成沙箱的基本组件
-
字节码校验器(bytecode verifier) :确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。
-
类装载器(class loader) :其中类装载器在3个方面对Java沙箱起作用
-
它防止恶意代码去干涉善意的代码;//双亲委派机制
-
它守护了被信任的类库边界;
-
它将代码归入保护域,确定了代码可以进行哪些操作。//沙箱安全机制
-
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成, 每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派模式。
- 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
- 存取控制器(access controller) :存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
- 安全管理器(security manager) : 是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
- 安全软件包(security package) : java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 消息摘要
- 数字签名
- 加密
- 鉴别
四.Native,方法区
Native
凡是带了native关键字的,说明java的作用范围打不到了,回去调用底层c语言的库
会进入本地方法栈,本地方法栈会调用本地方法接口(JNI)
JNI作用:拓展Java的使用,融合不同的编程语言为Java所用,最初:C,C++
Java诞生的时候,C,C++横行,想要立足,就必须调用C,C++的程序
它在内存区域中专门开辟了一块标记区域:Native Method Stack(本地方法栈),来登记Native方法,在最终执行的时候,通过JNI加载本地方法库中的方法
例如:
- Java程序驱动打印机,管理系统
掌握即可,在企业级应用中较为少见
调用其他接口:Socket,WebService,http
PC寄存器
程序计数器:Program Computer Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向像一条指令的地址,也即将执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计
方法区
Method Area 方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间
静态变量,常量,类信息(构造方法,接口定义),运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
方法区存储:static,final,Class,常量池
常量池包含的内容:
五.深入栈
栈
栈:数据结构,先进后出,后进先出
队列:先进先出
- 为什么main()先执行,最后结束:
main先被压到栈底,当main调用其它方法时,其它方法被压入栈中,按照栈先进后出的原则,main最后结束
栈的生命周期
栈:栈内存,主管程序的运行,生命周期和线程同步;
线程结束,栈内存也就释放了,对于栈来说,不存在垃圾回收问题
一旦线程结束,栈就over
栈存储的
八大基本类型 + 对象的引用 + 实例的方法
栈的执行原理
栈由多个栈帧组成
栈帧:
方法索引(Index),输入输出参数,本地变量,Class File(引用),父帧,子帧
每执行一个方法都会产生一个栈帧
程序正在执行的方法,一定在栈的顶部
栈满了就会抛出错误
栈,堆,方法区的交互关系
绿色为栈,浅蓝色为堆,粉色为方法区,蓝色为常量池
new一个对象,即在栈中创建引用后后在堆中创建具体实例,让栈中的引用指向堆中具体实例,堆中的常量来自常量池
Java语言并不要求常量一定只能在编译期产生,运行期间也可能产生新的常量,这些常量被放在运行时常量池中。
HotSpot和堆
三种JVM:
- Sun公司 HotSpot
- BEA公司 JRockit
- IBM公司 J9VM
我们学习的都是HotSpot
堆(Heap)
一个JVM只会有一个堆内存,堆内存的大小是可以调节的
-
类加载器读取了类文件后,一般会把什么东西放到堆中?
类,方法,常量,变量,保存我们所有引用类型的真实对象
堆内存中还要细分为三个区域:
-
新生区(伊甸园区)
-
养老区:old
-
永久区
JDK8以前:
GC垃圾回收:主要在伊甸园区和养老区
假设内存满了,OOM报错,堆内存不够
在JDK8后,永久存储区改了名字(元空间)
新生区,老年区,堆内存调优
新生区
- 对象诞生和成长的地方,甚至死亡
- 伊甸园区:所有对象都是在伊甸园区new出来的
- 幸存者区(0,1)
假设伊甸园区只能存储10个对象,一旦满了,就会触发轻GC(轻量垃圾回收)
活下来的对象存放到幸存区0区
如果幸存0区和幸存1区也满了,就会触发重GC,存活下来的对象就会进入养老区
如果新生区养老区都满了,就会爆错OOM
- 有99%的对象都是临时对象
永久区
这个区域是常驻内存的,用来存放JDK自身携带的Class对象,Interface元数据,存储的是Java运行时的一些环境或类信息,这个区域不存在垃圾回收,关闭VM虚拟机就会释放这个区域的内存
一个启动类,加载了大量第三方jar包,tomcat部署了太多的应用,大量动态生成的反射类,不断的被加载,直到内存满,就会出现OOM
- jdk1.6之前:永久代,常量池在方法区中
- jdk1.7:永久代,但是慢慢退化了,“去永久代”,常量池在堆中
- jdk1.8之后:无永久代,常量池在元空间
方法区是jvm的规范,元空间是具体的实现
元空间逻辑上存在,物理上不存在
默认情况下,分配的总内存是电脑内存的1/4,而初始化的内存为1/64
GC:垃圾回收机制
GC作用区:堆,方法区
JVM在进行垃圾回收时,并不是对这三个区域统一回收。大部分时候,回收都是新生代
- 新生代
- 幸存区(form区,to区)(两个区是互相交替的
- 老年区
GC两种类型:轻GC(普通的GC),重GC(全局的GC)
GC题目
- JVM的内存模型,详细到每个区放什么
- 堆里面的分区有哪些?Eden,form,to,老年区,说说他们的特点
- GC的算法有哪些?标记清除法,标记整理,复制算法,引用计数法(没用),怎么用
- 轻GC和重GC分别在什么时候发生
引用计数法
对对象的被引用次数进行计数(每个对象都要设定一个计数器),计数器本身也会有消耗,引用次数为0的被清除
复制算法
复制算法将内存划分为两个区间,在任意时间点,所有动态分配的对象都只能分配在其中一个区间(称为活动区间),而另外一个区间(称为空闲区间)则是空闲的。
当有效内存空间耗尽时,JVM将暂停程序运行,开启复制算法GC线程。接下来GC线程会将活动区间内的存活对象,全部复制到空闲区间,且严格按照内存地址依次排列,与此同时,GC线程将更新存活对象的内存引用地址指向新的内存地址。
谁空谁是to
- 没GC都会将Eden还存活的对象移到幸存区中:
- 一旦伊甸园区被GC后,就会是空的
- 当两个幸存区都不是空的时,一个区中的对象会被复制到另一个区中,这样就空出一个区
- 当一个对象经历了15次GC还没死,就会进入养老区
每次垃圾回收之后,伊甸园区是空的,to区也是空的,全部转移到了from区
- 好处:没有内存碎片
- 坏处:浪费了内存空间,多了一半空间永远是空的(to区),假设对象100%存活
复制算法最佳使用场景:新生区对象存活度较低的时候
标记清除算法
-
标记:扫描对象,对活着的对象进行标记
-
清楚:扫描对象,对没有标记的对象进行清除
-
优点:不需要额外的空间
-
缺点:两次扫描,严重浪费时间,会产生内存碎片,
标记压缩算法
标记清除再优化:
压缩:防止内存碎片产生,再次扫描,向一段移动存活的对象,多了一个移动成本
标记清除压缩
先标记清除几次,在进行压缩
总结
内存效率:复制算法 > 标记清除算法 > 标记压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存利用率:标记压缩算法 = 标记清除算法 > 复制算法
,to区也是空的,全部转移到了from区
- 好处:没有内存碎片
- 坏处:浪费了内存空间,多了一半空间永远是空的(to区),假设对象100%存活
复制算法最佳使用场景:新生区对象存活度较低的时候
标记清除算法
-
标记:扫描对象,对活着的对象进行标记
-
清楚:扫描对象,对没有标记的对象进行清除
-
优点:不需要额外的空间
-
缺点:两次扫描,严重浪费时间,会产生内存碎片,
标记压缩算法
标记清除再优化:
压缩:防止内存碎片产生,再次扫描,向一段移动存活的对象,多了一个移动成本
标记清除压缩
先标记清除几次,在进行压缩
总结
内存效率:复制算法 > 标记清除算法 > 标记压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存利用率:标记压缩算法 = 标记清除算法 > 复制算法