Java 对象结构_牛客博客

Java 对象(Object 实例)结构包括三部分:对象头、对象体、对齐字节。

Java 对象(Object 实例)的三个部分

对象头

对象头包括三个字段，第一个字段叫做 Mark Word(标记字)，用于存储自身运行时的数据例如 GC 标志位、哈希码、锁状态等信息。

第二个字段叫做 Class Pointer(类对象指针)，用于存放方法区 Class 对象的地址，虚拟机通过这个指针来确定这个对象是哪个类的实例。

第二个字段叫做 Array Length(数组长度)。如果对象是一个 Java 数组，那么此字段必须有，用于记录数组长度的数据;如果对象不是一个 Java 数组，那么此字段不存在，所以这是一个可选字段。

对象体

对象体包含了对象的实例变量(成员变量)。用于成员属性值，包括父类的成员属性值。这部分内存按 4 字节对齐。

对齐字节

对齐字节也叫做填充对齐，其作用是用来保证 Java 对象在所占内存字节数为 8 的倍数(8N bytes)。HotSpot VM 的内存管理要求对象起始地址必须是 8 字节的整数倍。对象头本身是 8 的倍数，当对象的实例变量数据不是 8 的倍数，便需要填充数据来保证 8 字节的对齐。

对象结构中的核心字段作用

Mark Word(标记字)字段主要用来表示对象的线程锁状态，另外还可以用来配合 GC、存放该对象的 hashCode。
Class Pointer(类对象指针)字段是一个指向方法区中 Class 信息的指针，意味着该对象可随时知道自己是哪个 Class 的实例。
Array Length(数组长度)字段也占用 32 位(在 32 位 JVM 中)的字节，这是可选的，只有当本对象是一个数组对象时才会有这个部分。
对象体用于保存对象属性值，是对象的主体部分，占用的内存空间大小取决于对象的属性数量和类型。
对齐字节并不是必然存在的，也没有特别的含义，它仅仅起着占位符的作用。当对象实例数据部分没有对齐(8 字节的整数倍)时，就需要通过对齐填充来补全。

对象结构中的字段长度

Mark Word、Class Pointer、Array Length 等字段的长度，都与 JVM 的位数有关。Mark Word 的长度为 JVM 的一个 Word(字)大小，也就是说 32 位 JVM 的 Mark Word 为 32 位，64 位 JVM 为 64 位。Class Pointer(类对象指针)字段的长度也为 JVM 的一个 Word(字)大小，即 32 位的 JVM为32位，64位的JVM为64位。

所以，在 32 位 JVM 虚拟机中，Mark Word 和 Class Pointer 这两部分都是 32 位的;在 64 位 JVM 虚拟机中，Mark Word 和 Class Pointer 这两部分都是 64 位的。

对于对象指针而言，如果 JVM 中对象数量过多，使用 64 位的指针将浪费大量内存，通过简单统计，64 位的 JVM 将会比 32 位的 JVM 多耗费 50%的内存。为了节约内存可以使用选项 +UseCompressedOops 开启指针压缩。选项 UseCompressedOops 中的 Oop 部分为 Ordinary object pointer 普通对象指针的缩写。

如果开启 UseCompressedOops 选项，以下类型的指针将从 64 位压缩至 32 位:

Class 对象的属性指针(即静态变量)
Object 对象的属性指针(即成员变量)
普通对象数组的元素指针

当然，也不是所有的指针都会压缩，一些特殊类型的指针不会压缩，比如指向 PermGen(永久代)的 Class 对象指针(JDK8 中指向元空间的 Class 对象指针)、本地变量、堆栈元素、入参、返回值和 NULL 指针等。

如果对象是一个数组，那么对象头还需要有额外的空间用于存储数组的长度(Array Length 字段)。Array Length 字段的长度也随着 JVM 架构的不同而不同:32 位的 JVM 上，长度为 32 位; 64 位 JVM 则为 64 位。64 位 JVM 如果开启了 Oop 对象的指针压缩，Array Length 字段的长度也将由64位压缩至32位。

Mark Word 的结构信息

Java 内置锁的涉及到很多重要信息，这些都存放在对象结构中，并且是存放于对象头的 Mark Word 字段中。Mark Word 的位长度为 JVM 的一个 Word 大小，也就是说 32 位 JVM 的 Mark word 为 32 位，64 位 JVM 为 64 位。Mark Word 的位长度不会受到 Oop 对象指针压缩选项的影响。

Java 内置锁的状态总共有四种，级别由低到高依次为:无锁、偏向锁、轻量级锁、重量级锁。

其实在 JDK 1.6 之前，Java 内置锁还是一个重量级锁，是一个效率比较低下的锁，在 JDK 1.6 之后，JVM 为了提高锁的获取与释放效率，对 synchronized 的实现进行了优化，引入了偏向锁、轻量级锁的实现，从此以后 Java 内置锁的状态就有了四种(无锁、偏向锁、轻量级锁、重量级锁)，并且四种状态会随着竞争的情况逐渐升级，而且是不可逆的过程，即不可降级，也就是说只能进行锁升级(从低级别到高级别)。

不同锁状态下的 Mark word 字段结构

Mark word 字段的结构，与 Java 内置锁的状态强相关。为了让 Mark word 字段存储更多的信息，JVM 将 Mark word 的最低两个位设置为 Java 内置锁状态位，不同锁状态下的 32 位 Mark Word 结构。

64位锁结构信息

lock:锁状态标记位

占 2 个二进制位，由于希望用尽可能少的二进制位表示尽可能多的信息，所以设置了 lock 标记。该标记的值不同，整个 Mark Word 表示的含义不同。
biased_lock

对象是否启用偏向锁标记，只占 1 个二进制位。为 1 时表示对象启用偏向锁，为 0 时表示对象没有偏向锁。

lock 和 biased_lock 两个标记位组合在一起，共同表示 Object 实例处于什么样的锁状态。二者组合的含义如下：

age

4位的 Java 对象分代年龄。在 GC 中，如果对象在 Survivor 区复制一次，年龄增加 1。当对象达到设定的阈值时，将会晋升到老年代。默认情况下，并行 GC 的年龄阈值为 15，并发 GC 的年龄阈值为 6。由于 age 只有 4 位，所以最大值为 15，这就是-XX:MaxTenuringThreshold 选项最大值为 15 的原因。
identity_hashcode

31 位的对象标识 HashCode(哈希码)，采用延迟加载技术，当调用 Object.hashCode( )方法或者 System.identityHashCode( ) 方法计算对象的 HashCode 后，其结果将被写到该对象头中。当对象被锁定时，该值会移动到 Monitor(监视器)中。
thread

54 位的线程 ID 值，为持有偏向锁的线程 ID。
epoch

偏向时间戳。
ptr_to_lock_record

占 62 位，在轻量级锁的状态下，指向栈帧中锁记录的指针。
ptr_to_heavyweight_monitor

占 62 位，在重量级锁的状态下，指向对象监视器 Monitor的指针。

作者：茶还是咖啡
链接：https://juejin.cn/post/6993308982081224711