java内存分配

对象的创建

创建一个对象通常是需要new关键字,当虚拟机遇到一条new指令时,首先检查这个指令的参数是否在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果类没有被加载,那么执行相应的类加载过程。
对象所需内存的大小在类加载完成后便完全确定(JVM可以通过普通Java对象的类元数据信息确定对象大小)
为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。有两种分配方式:

  • 指针碰撞
    假设Java堆中内存是绝对规整的,用过的和空闲的内存各在一边,中间放着一个指针作为分界点的指示器,分配内存就是把那个指针向空闲空间的那边挪动一段与对象大小相等的距离。
  • 空闲列表
    如果Java堆中的内存不是规整的,虚拟机就需要维护一个列表,记录哪个内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。
    采用哪种分配方式是由Java堆是否规整决定的,而Java堆是否规整是由所采用的垃圾收集器是否带有压缩整理功能决定的。

此外,还需要考虑内存分配时的线程安全问题。有两种解决方案:

  • 一种是对分配内存空间的动作进行同步处理,JVM采用CAS(Compare and Swap)机制加上失败重试的方式,保证更新操作的原子性。CAS:有3个操作数,内存值V,旧的预期值A,要修改的新值B。当且仅当预期值A和内存值V相同时,将内存值V修改为B,否则什么都不做;
  • 另一种是把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存(TLAB),哪个线程要分配内存就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时才需要同步锁定。JVM通过"-XX:+/-UseTLAB"指定是否使用TLAB。

内存分配完成后,虚拟机需要将分配到的内存空间初始化为零值。这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就可以直接使用。接下来虚拟机要对对象进行必要的设置,包括类元数据引用、对象的哈希码、对象的GC分代年龄等。

上面的工作都完成以后,从虚拟机的角度来看一个新的对象已经产生了。但是从Java程序的角度,还需要执行init方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。

对象的内存布局

对象在内存中存储的布局可分为三个部分: 对象头、实例数据和对齐填充。
对象头包括两个部分:第一部分用于存储对象自身的运行时数据,如哈希码、GC分代年龄、线程所持有的锁等。官方称之为“Mark Word”。第二个部分为是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

实例数据是对象真正存储的有效信息,也是程序代码中所定义的各种类型的字段内容。

对齐填充并不是必然存在的,仅仅起着占位符的作用。、Hotpot VM要求对象起始地址必须是8字节的整数倍,对象头部分正好是8字节的倍数,所以当实例数据部分没有对齐时,需要通过对齐填充来对齐。

对象的访问定位

Java程序通过栈上的reference数据来操作堆上的具体对象。主要的访问方式有使用句柄和直接指针两种:
句柄:Java堆将会划出一块内存来作为句柄池,引用中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息 。如图所示:
java内存分配
直接指针:Java堆对象的布局要考虑如何放置访问类型数据的相关信息,引用中存储的就是对象地址 。如图所示:
java内存分配
两个方式各有优点,使用句柄最大的好处是引用中存储的是稳定的句柄地址,对象被移动时只会改变句柄中实例的地址,引用不需要修改、使用直接指针访问的好处是速度更快,它节省了一次指针定位的时间开销。